求むPython/NLPハッカー

ソーシャルメディアのセンチメントアナリティックススタートアップが日本語ネィティブのエンジニアを探している。
http://www.netbase.com/job-posting/search-quality-engineer-japanese/
就労ビザ

実はこの仕事応募して受け入れられたんだけおど、個人的な理由で断わることになってしまった。厳しいインタビューのプロセスを経ると雇われていなんだけどチームと連帯感とかが発生するんだよね。それで、失望させてしまった申し訳なさからお手伝いを申し出た。リクルーティングボーナスなどの利害関係は一切ない。唯一下心があるとしたら、ここで良い印象を与えておいて次回縁があるときに覚えてもらいたい、ぐらい。

但し書き: 以下、面接過程の記憶から書いているので間違いや現時点であてはまらない情報があることが考えられる。あくまでも参考として読んでほしい。そしてnetbaseは以下の内容について何の責任ももっていないことを理解してほしい。

仕事内容は検索結果のrelevanceを管理するPythonシステムの構築と日本語におけるパフォーマンス評価作業と理解した。部門はQAっていうことになっているが、仕事の内容はツール開発と言語エンジンの評価と考えていいだろう。つまり、カスタマに直接触れる部分ではない。

ここで野心のあるエンジニアは「スケーラブルなエンジンをつくりたい」と思うが、しかし、ML系ではエンジンの部分は次々とインフラとしてcommodity化されていく傾向にある思う。最近だけでも、スタートアップやapache foundationからおびだたしい数のBig Data/MLツールが公開されている。最近の面接体験で、今迄かっこよかった「スケーラブルなシステム」ってのは実は金の力にまかせでマシンを横に並べたのをJava系のツールでつなぐだけの型にはまったオペレーションになりつつあると感じるようになってきた。

一方、いくらマシンを投入しても計算機はおバカさん。人間様が教えてあげないと学習できない。そしてデータから学ぶこととそうして得た情報の応用はビジネスの中核と切り離せないので、これがcommodity化されることはありえない。インフラよりデータ解析とML評価の方がビッグデータの時代で生き延びるのに有利。

そういう意味でこの仕事は面白いなと思った、ってのは知的正当化で、単にデータに触れる仕事がしたかっただけだ。だって日本語のツイートとか眺め(言語エンジニアが)その意味を汲み取ることを支援するなんて面白そうでしょ。しかもそれがpythonでできるんだから最高。

上司となる人はすごく切れる感じの言語学者。面接の過程であらゆる要望にきめこまく対応してくれた。同僚となるエンジニアはかなりのPythonハッカーだ。題材としてもチーム面でも申し分の無いポジションだった。

俺がつけなかったこのポジション、読者の一人が手にいれることを願う。もし質問とかあったら karasuyamatengu あっと gmail.com まで