Bash片段的Apache错误日志,以显示什么URLS导致404s?

我有一个标准的Apache错误日志文件。 我想看看哪些url导致404s,因为我已经移动了这个网站,我想find不好的链接。 任何人都可以推荐一个bash片段,将parsing这个日志使用awk或东西来显示stream行的404s?

我知道有这种事情的高级程序。 我只是在寻找一些简单的东西。

这应该做到这一点:

grep ' 404 ' /var/log/apache2/access.log | cut -d ' ' -f 7 |sort |uniq -c |sort -n 

awk答案:

 awk '$9 == 404{urls[$7]++}END{for (url in urls) print urls[url] "\t" url}' access_log | sort -n 

这只是为了好玩,因为它可能比womble解决scheme慢得多