ドメドメな環境に飽きてきた
今日のネタは技術ブログらしからぬ感じ。
日本に帰国して早5年。日本に見向きもせず仕事の全てを英語でやっていた頃が遠い昔に感じる今日この頃。日本語だけでコミニュケーションすればいい(※1)のは楽と言えば楽だけど、何だか物足りない。
そんな中、先日新宿を散歩していて、ふと洋書店に立ち寄って、「買ってくれオーラ」を出していたこの本を買ってみました。
The Culture Map (INTL ED): Decoding How People Think, Lead, and Get Things Done Across Cultures
- 作者: Erin Meyer
- 出版社/メーカー: PublicAffairs
- 発売日: 2016/01/05
- メディア: ペーパーバック
- この商品を含むブログを見る
異文化理解力――相手と自分の真意がわかる ビジネスパーソン必須の教養
- 作者: エリン・メイヤー,田岡恵,樋口武志
- 出版社/メーカー: 英治出版
- 発売日: 2015/08/22
- メディア: 単行本
- この商品を含むブログ (3件) を見る
買ったのは上の方ね。下の本は、上の本の日本語版だと思ったんだけど、発売日からして別の本かも。
この三連休に最初の章を読んでみたんだけど、あるある過ぎて一気にのめり込んでしまいました。多文化な環境で仕事するときのあるあるがスッと理論的に腹落ちして行く感じ。
例えば、中国で仕事しているときは、ボスはドイツ人、同僚はほぼ中国人だったんだけど、中国人の同僚から、こんな事を言われました。
中国人「ボスのやり方は理解できない、お前は同じアジア人だから分かるだろ?」
・・・え?君たちの考え方もかなり欧米寄りだと思うんだけど。と、心の中で呟きつつ、
自分「そ、そうだね…」
と、返したのを覚えてます。Negative feedbackの仕方がとても直接的なドイツ人、その正反対な日本人(自分)。中国人はその間、やや日本寄りなポジションにいるので、中国人から見ると、「お前なら分かるだろ?」になるけど、日本人から見ると「お前ら、どっちもどっち」と感じると。印象というか感情は、相対的な位置関係で決まると本の中で言われると、確かにそうだなと納得。
そんな懐かしい日々を思い出しつつ、Linked-inで元同僚がバンバン出世しているのを見るにつけ、このままではいけない気がすると思う今日この頃でございます。
とは言え、ノスタルジーに浸ってるだけでアクション起こさないのはおじさんになった証拠かな。
※1 たまにオフショアの中国人とやりとりするけど、今やりとりしている某社は、日本語人材なので、本当に英語を使う機会がない。
anacondaの再インストールの話
これにとんでもない落とし穴があったという話を記録のために残しておきます。
Macでデータいじりに使っているPythonを3.6にアップデートしようと思ってconda update —allをやってみたけど、3.5のまま。 #stackoverflow で調べたら、GUIのインストーラーで再インストールしてみたら上手くいったというアドバイスを見つけたので、やってみたら無事にアプデ完了
— Kem / けむ (@Deutschina) August 16, 2018
結果から言うと、これはダメでした。Pythonが3.6系になり安心していたのですが、後日データをいじり始めたら、とんでもないトラブルが待っていました。
いつものように、Numpyをインポートして、行列を作ろうとしたら・・・。
>>> import numpy as np
>>> x = np.array([1, 2, 3])
AttributeError: 'module' object has no attribute 'array'
「ファ!?」ってリアルで声上げてしまいました。NumPyにarrayがないってあり得ないでしょ。と思って、StackOverflowなどを調べて見ると、Numpy.pyのファイルが複数ある(認識されている)ということらしい。ということで、anacondaをアンインストールして再インストールすることに。
参考にさせていただいたのがこちらの記事。
anaconda-clearnを実行するだけでも、いろいろ起動できるので、anacondaフォルダを削除することに。この記事ではHome直下とあるけど、自分のMacのフォルダを調べると、Home直下にanaconda3 というフォルダが1つ、さらにUsersの自ユーザの直下にanacondaとanaconda3というフォルダが存在しており、それら3つを全部消して再インストールしたことで、ようやく問題解決。なお、PATHの削除の部分は、後で再インストールするのでいじってません。
ようやく環境がきれいになり、当初の目的通りPython 3.6.5でゴニョゴニョ出来るようになりました。
めでたしめでたし。
オライリーのPython & 機械学習本が渋滞気味なので整理してみた
初めて目次を付けてみました。
新刊本絶賛渋滞中
オライリーのPythonベースで機械学習を取り扱っている本の出版(日本語翻訳化)の勢いはすごいですね。これを書いている今日(2018/8/17)もこの本が発売になり、早速入手しました。
直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ
- 作者: Antonio Gulli,Sujit Pal,大串正矢,久保隆宏,中山光樹
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/08/17
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
半ば反射的に買ってしまう自分も自分ですが、同じオライリーでも似たような本が立て続けに出ており、ブームが終わる前に出せるだけ出しておけという空気を感じなくもありません。
権利関係の話はよく分かりませんが、日本語版のオライリーの本を分類してみると、
これらが一緒くたになってオライリーを名乗って出版されるので、どの本を読めば良いのか分からなくなって、私みたいに全部買うバカも出てくる訳ですね(苦笑)。
ということで、自分なりに整理してみようというのがこの記事の意図です。一応、どっちが良いかというコメントを書いているものもありますが、本の合う合わないは個人差があるので、あくまで参考程度にとどめて下さい。
機械学習の王道部門
いわゆる「機械学習勉強したいんだけど、何か良い本ない?」と聞かれたときに、候補になりそうな本ですね。このブログでも何回か取り上げられているはず。ノミネートはこの2冊。
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
- 作者: Andreas C. Muller,Sarah Guido,中田秀基
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/05/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
scikit-learnとTensorFlowによる実践機械学習
- 作者: Aurélien Géron,下田倫大,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/04/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
Numpy, Pandas, Matplotlibなどの基本がやりたい部門
前段で取り上げたscikit-learnとTensorFlowによる実践機械学習のオマケも相当充実しているので、それでも十分事足りると思いますが、それでもNumpyとかPandasのデータ処理の基本を押さえておきたいという場合に候補になる本です。
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- 作者: Jake VanderPlas,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理が2012年の第1版で止まっていたなら、Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習の一択かなというところだったのですが、第2版が出てPython3.6対応になったところで、甲乙付けがたくなりました。前者はpandasの開発者の著作なので、pandasが重めですが、時系列データの扱い方とか、むしろ知りたかったところに手が届くという意味で前者を推したい。
日本オリジナル部門
オライリー本は英語からの翻訳だけではないよねということで、日本オリジナル本を上げてみたいと思います。これは甲乙付ける感じではありませんが。
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- 作者: 斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2016/09/24
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (18件) を見る
ゼロから作るDeep Learning ? ―自然言語処理編
- 作者: 斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/21
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
- 作者: 有賀康顕,中山心太,西林孝
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/01/16
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (4件) を見る
keras部門
オライリーには長らくkerasを扱った本が見当たらなかったので、比較という意味ではオライリー以外の本を持ってくるしかありません。
直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ
- 作者: Antonio Gulli,Sujit Pal,大串正矢,久保隆宏,中山光樹
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/08/17
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
- 作者: Francois Chollet,巣籠悠輔,株式会社クイープ
- 出版社/メーカー: マイナビ出版
- 発売日: 2018/05/28
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
実践 Deep Learning ―PythonとTensorFlowで学ぶ次世代の機械学習アルゴリズム (オライリー・ジャパン)
- 作者: Nikhil Buduma,太田満久,藤原秀平,牧野聡
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/04/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
Pythonの基本部門
最後に、Python自体を勉強したいんですけどという場合の本を2冊。Pythonの入門自体も本が多いものの、敢えて中級者向けの本を挙げてみました。
- 作者: Bill Lubanovic,斎藤康毅,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/12/01
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
Fluent Python ―Pythonicな思考とコーディング手法
- 作者: Luciano Ramalho,豊沢聡,桑井博之,梶原玲子
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/10/07
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
長くなりましたが、機械学習を楽しみましょう。
ファイナンス、ファイナンス、ファイナンス
あの時は何も役に立たなかったなという事が、10年ぐらい経って急に役立つ時が来る。大学の第二外国語の中国語しかり、大学院で習ったファイナンスしかり。無駄ってないんだな。キャリアって、そうやって築かれて行くものなんだなってふと思う三連休の真ん中。
— Kem / けむ (@Deutschina) July 15, 2018
以前、CouseraでMachine Learning for FinanceというSpecializationを受講しているという話を書きましたが、プログラミング課題の自動採点機能に不具合があって、正しいものを書いてもエラーになるという問題が発生しています。これは解消したとのメールが来たものの、今度は課題の提出ボタンを押すとエラーになるという別の問題が。毎月受講料を払うという料金体系である以上、不具合解消待ちにお金を払い続けるのも違う気がして、サブスクリプションを一時的に解除しています。
コースの内容的には是非とも学んでおきたい内容なので、問題が解消したら復帰するつもりでいますが、復帰後にもう少し楽ができるように、もう少しファイナンスの知識をつけておきたいなと思うようになりました。というのも講義動画を見ていると、英語で小難しい数式が頻繁に出て来て、なんとか食らいつこうとするものの、時々意識が飛んでしまいます。機械学習などの多少見慣れた概念なり用語であれば英語でも何とかなりますが、ファイナンスを英語で習った事がないので、自分の脳内辞書にはそのあたりのボキャブラリーがなく、やはり聞くだけでは苦しいですね。
機械学習 meets ファイナンスの瞬間
話はCourseraからの一時離脱をする直前に遡るのですが、自動採点機能のバグにぶち当たり、金払って苦行する意味があるのか、さっさと離脱した方がいいんじゃないかと自問自答しながら進めていた課題の中に、こんな課題がありました。S&P 500のインデックスと個別の株価が時系列で与えられていて、β(ベータ)を求めなさいと。もちろんβを求めるのがゴールではなく、計算の過程で算出して後続で使うのですが、このβという単語にピンと来たのです。
・・・これ、昔習ったな
今を遡る事16年前w。当時流行りだった社会人向けの会計大学院に通っていた自分は、「ファイナンス基礎I」という科目が必修科目であることを夏休み直前になって知り、慌てて1週間の夏期集中講座に申し込んだのでした。
当時はシステム屋で会計領域を担当していたこともあり、会計は学ばねばと思っていたものの、ファイナンス?なんだか数学が面倒臭そう。というイメージ先行で、見向きもしていなかったのです。とは言え、必修科目である以上、履修を避ける訳にはいきません。
しかし、実際に授業に出てみると、これが楽しい。今でも一線で活躍されている著名な先生による授業は分かりやすい。もちろん、丸一日の授業を1週間ぶっ続けで受ける体力的な厳しさはあったものの、なんか楽しい思い出が残っているのです。
あれ、結構覚えている
当時の教科書は、実家で眠っているはずですが、取りに戻る時間がなかったので、とりあえず書店で平積みになっているこの本を買ってきて読むことにしました。一気に読んでみると、あれも習ったな、これも習ったなみたいな感じで思い出していきます。
- 作者: 石野雄一
- 出版社/メーカー: 日本実業出版社
- 発売日: 2005/08/25
- メディア: 単行本(ソフトカバー)
- 購入: 40人 クリック: 946回
- この商品を含むブログ (54件) を見る
ファイナンスって、結構面白いじゃんという思いを新たにして、諸々の問題が解決したら、Courseraのコースに戻ろうというモチベーションが上がって来ました。
16年ぶりのコーポレートファイナンス。学生の時は第6版だったかな? pic.twitter.com/lezshH9Xhl
— Kem / けむ (@Deutschina) July 15, 2018
これを買ったのはやりすぎだったかもw
ちなみに
大学院生の頃のファイナンス楽しい!には後日談があります。持ち込み可の試験で比類なき強さを示す自分は、試験で結構な高得点を叩き出し、俺はファイナンスに向いているんだと勘違いして、夏休み明けに任意受講科目のファイナンスIIという科目のガイダンスを聞きに行きました。しかし、出てくる数学が高度過ぎたのとテキストが英語だったので尻込みして、ファイナンス熱は一気に下がったのでした。この時頑張っていたら、今頃違うキャリアを歩んでいたかもしれないですね。
とは言え、今勉強している機械学習というコンテンツと昔習ったファイナンスがポンと出会うのもなんかの縁だなと思って、冒頭のツイートに繋がったわけです。
企業価値評価もやったな…成績はイマイチだったけど。
企業価値評価 第6版[上]―――バリュエーションの理論と実践
- 作者: マッキンゼー・アンド・カンパニー,ティム・コラー,マーク・フーカート,デイビッド・ウェッセルズ,マッキンゼー・コーポレート・ファイナンス・グループ
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2016/08/26
- メディア: 単行本
- この商品を含むブログを見る
企業価値評価 第6版[下]―――バリュエーションの理論と実践
- 作者: マッキンゼー・アンド・カンパニー,ティム・コラー,マーク・フーカート,デイビッド・ウェッセルズ,マッキンゼー・コーポレート・ファイナンス・グループ
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2016/08/26
- メディア: 単行本
- この商品を含むブログを見る
機械学習ジャーニーのお供に
気になったことを書き溜めただけで一貫性のない弊ブログですが、「機械学習」というキーワードを入れた記事を出すと、アクセス数が増えるというのが最近の傾向です。それだけ機械学習熱が上がっていて、自分でも試してみようという人が増えているんでしょうね。
機械学習を進める上でのストレス要因
先日もCourseraの受講のことだったり、オススメ本の話を書いたりと、自分自身でも機械学習について学ぶという事は相変わらず続いているものの、いつもモヤっとした部分が残ります。
ライブラリの使い方とか、基本的なコンセプトは分かっても、その足元の部分、つまりデータを用意したり、そのデータを加工して大まかな傾向を掴むと言った機械学習の最初のステップのところの足元が弱いなあと思う今日この頃です。
仕事として機械学習を使っているプロの皆さんは置いておいて、私のように仕事とはあまり関係なく、機械学習に興味を持って飛び込んで、まずは機械学習の入門書から入った皆さんの場合、例えばPandasのデータフレームの使い方だったり、Matplotlibで自分の思うようにプロットしてみるという部分がうまく使いこなせていなくてストレスを感じているってことはないですかね?
私は結構ストレスになっていて、機械学習じゃなくて、データサイエンスのE-Learningでも受けようかと真剣に検討していたぐらいです。
こういうのを待っていた
そんな中、こんな本がつい最近出たのを見つけてしまいました。
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- 作者: Jake VanderPlas,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
この領域の本、これまでもあるにはあったのですが、日本語の本だと内容的に少し古くなったなと感じるものが多かったので、個人的には良いタイミングで出て来てくれました。
最終章のscikit-learnのところは手持ちの本でカバーできているものの、最初の4章分はまさにブラッシュアップしたかった内容でドンピシャです。結構分厚い本ですが、やりたい事がリファレンス的に参照できて重宝しそうです。
ちなみに英語版はテキスト含め全文Githubで公開されているので、中身をちょい見してから、日本語で深く読みたい!となれば購入してみるのはいかがでしょう?
お世話になった本たち
色褪せたみたいな事を書いてしまいましたが、自分の中ではいろいろなきっかけを与えてくれた名著です。
Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,小林儀匡,鈴木宏尚,瀬戸山雅人,滝口開資,野上大介
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/12/26
- メディア: 大型本
- この商品を含むブログ (19件) を見る
この本でNumpyとpandasの存在を知りました。
IPythonデータサイエンスクックブック ―対話型コンピューティングと可視化のためのレシピ集
- 作者: Cyrille Rossant,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/12/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
この本からJupyter Notebookにたどり着きました。