ハッカーニュース人気言語

「好きな言語は?」というアンケートのページ http://news.ycombinator.com/item?id=3746692 から。


Actionscript


Ada


Assembly


C


C++


C#


Clojure


Cobol


CoffeeScript


ColdFusion


D


Delphi


Erlang


Forth


Fortran


Haskell


Java


JavaScript


Lisp


Lua


Objective C


OCaml


Pascal


Perl


PHP


Python


Rexx


Ruby


Scala


Scheme


Shell


Smalltalk


SQL


Tcl


Visual Basic


Other


Groovy


グラフはこんなコマンドで生成


w3m -dump 'http://news.ycombinator.com/item?id=3746692' \

sed -n '/Please up vote this poll to keep it alive./,/\[ *\]/p' \
grep -v 'Please up vote this poll to keep it alive.' \
grep -v '^ *\[ *\] *$' \
sed 's/\[grayarrow\]//' \
sed 's \([0-9][0-9]*\) points <span style="width:\1px; height: 1em; background:#cceecc; border: 1px solid #000; display: inline-block" ></span><br/> ' \
sed 's ^ *\([^<]*\) <span style="width:50; display: inline-block; white-space:nowrap;">\1</span> ' \
sed 's/(.*)//' \
tee x.html

awkによる実装: http://gauc.no-ip.org/awk-users-jp/blis.cgi/DoukakuAWK_308
bashによる実装 http://d.hatena.ne.jp/labunix/20120324
こういうスクレーピングはphantomjsでjqueryとか使ってやるのが近代的な手段なんだろう。ウェブのスクレープはウェブ技術でやるのがいいにきまっている。しかし、grep,sed,awkなどのコマンドは常に手元になるのでついそっちにいってしまう。ウェブで育った人達にはJavaScriptでウェブツールを操作する方が自然なのかもしれない。