ドメドメな環境に飽きてきた

今日のネタは技術ブログらしからぬ感じ。 日本に帰国して早5年。日本に見向きもせず仕事の全てを英語でやっていた頃が遠い昔に感じる今日この頃。日本語だけでコミニュケーションすればいい(※1)のは楽と言えば楽だけど、何だか物足りない。 そんな中、先日新…

anacondaの再インストールの話

これにとんでもない落とし穴があったという話を記録のために残しておきます。Macでデータいじりに使っているPythonを3.6にアップデートしようと思ってconda update —allをやってみたけど、3.5のまま。 #stackoverflow で調べたら、GUIのインストーラーで再イ…

オライリーのPython & 機械学習本が渋滞気味なので整理してみた

初めて目次を付けてみました。 新刊本絶賛渋滞中 機械学習の王道部門 Numpy, Pandas, Matplotlibなどの基本がやりたい部門 日本オリジナル部門 keras部門 Pythonの基本部門 新刊本絶賛渋滞中 オライリーのPythonベースで機械学習を取り扱っている本の出版(日…

ファイナンス、ファイナンス、ファイナンス

あの時は何も役に立たなかったなという事が、10年ぐらい経って急に役立つ時が来る。大学の第二外国語の中国語しかり、大学院で習ったファイナンスしかり。無駄ってないんだな。キャリアって、そうやって築かれて行くものなんだなってふと思う三連休の真ん中…

機械学習ジャーニーのお供に

気になったことを書き溜めただけで一貫性のない弊ブログですが、「機械学習」というキーワードを入れた記事を出すと、アクセス数が増えるというのが最近の傾向です。それだけ機械学習熱が上がっていて、自分でも試してみようという人が増えているんでしょう…

Coursera : Machine Learning with TensorFlow on Google Cloud Platform修了

4月の末から取り組んでいたCourseraのMachine Learning with TensorFlow on Google Cloud Platformの全5コースですが、週末や朝晩の通勤時間なんかも使いながら、約1ヶ月と少しで全5コース修了しました。一応、自腹でちゃんと受講したよという意味を込めて、…

iPhoneのHealthデータをエクスポートしてゴニョゴニョしてみる その5

この記事の続きです。deutschina.hatenablog.comiPhoneのHealthデータの加工の流れがあらかた出来たので、Nokia Healthから持ってきた歩数(activity)データとぶつけてみるところから。 いざ突合へ イメージとしては、Nokia Health側のデータにiPhoneのデータ…

iPhoneのHealthデータをエクスポートしてゴニョゴニョしてみる その4

この記事の続きです。deutschina.hatenablog.com やりたいことはだいたい自動提案されてくる Dataprepを使っていいなと思うのは、処理した列を選択(クリック)すると、右側に処理候補がいくつか自動提案されてきて、やりたいことが、だいたいその中に入ってい…

iPhoneのHealthデータをエクスポートしてゴニョゴニョしてみる その3

この記事の続きです。deutschina.hatenablog.com Google Dataprep登場! ひとまずiPhoneのHealthデータを取り出すことが出来たので、いよいよNokia Healthのデータと突合してみます。Nokia Healthからの歩数データの記録が抜けている部分をiPhoneのデータで…

iPhoneのHealthのデータをエクスポートしてゴニョゴニョしてみる(その2)

この記事の続きです。deutschina.hatenablog.com前の記事で、iPhoneのHealthデータをCSVに変換しました。後で本丸であるNokia Health(旧Withings)のデータとマージするんだけど、その前に、もう少しデータの中身を確認しておこうということで、pandasのdataf…

iPhoneのHealthデータをエクスポートしてゴニョゴニョしてみる

最近機械学習の流れで、やっぱり自分でこねくり回せるデータの方が色々覚えるかなということで、自分が持っている加工しがいのあるデータを使ってみようかと思い立った週末の午後。と言っても、2010年から取り続けているWithings(現Nokia Health)の体重関連…

Courseraで機械学習+クラウドを学んでみる

連休の暇つぶしに 機械学習本を買い込んで写経をする勉強もいいけど、何か形が残る方が良いかなという事で、CourseraのMachine Learning with TensorFlow on Google Cloud Platformというコースを受講してみることにしました。 このコースを知るきっかけにな…

機械学習のお勧め本に日本語版が出た!

deutschina.hatenablog.com 以前の記事で、機械学習本の中で、一番好きだと言っていたあの本の日本語版が出ました! scikit-learnとTensorFlowによる実践機械学習 作者: Aurélien Géron,下田倫大,長尾高弘 出版社/メーカー: オライリージャパン 発売日: 2018…

checkioが意外と楽しい

プログラミング言語は使わないと忘れるので、時間があるときにcheckioというサイトでコーディングの練習?をしています。checkio.orgPythonとJavaScriptが選べて、課題に挑戦してクリアすると、他の人が同じ課題のために書いたコードが見れて、あ、こんな風…

Nokia Steel HRにしたよ

かなり以前にJowboneの活動量計を使っていたんだけど、この度Nokia Steel HRを使い始めたという話。Nokia スマートウォッチ Steel HR 心拍&アクティビティモニター(36mmモデル) ホワイト 【日本正規代理店品 HWA03-36WHITE-ALL-JP出版社/メーカー: Nokia発売…

機械学習のお勧め本

100%主観だけど、優勝はこの本だね。 Hands-On Machine Learning With Scikit-Learn and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems 作者: Aurelien Geron 出版社/メーカー: Oreilly & Associates Inc 発売日: 2017/04/09 …

機械学習が近寄って来た

TwitterのプロフィールにMachine Learningと書いているものの、これまでは趣味の領域というか、本業とは関わりのないものだったんだけど、今年に入って急にMachine Learningの考え方が本業にも登場して来た感じがするので、久しぶりに独学で勉強を始めてみた…

初めてジーニアスバーを使ってみた話

バッテリーがへたる 家のPCをMacに変えてから早10年。我が家で一番新しい一番新しいMBP Retina early 2013 が主力となっている訳ですが、最近バッテリー駆動時間がやたら短くなる?という現象に苛まれております。 いつもは書斎で電源ケーブルに繋がれている…

年に一度のプリンタ稼働日

年末タスク 年末に実家に帰ると年賀状印刷というタスクが待っているわけですが、去年のこの時期にプリンタのノズルが目詰まりして、字がかすれてしか印刷できず、最後通告をしたつもりが、 父「今年もよろしく」 と何事もなかったように頼まれる訳で。とは言…

Windows10での環境構築

サボりの原因は 気がつけば9ヶ月も放置してました。2015年年末から入門Python 3の写経シリーズをやって、3月頃にはグラフデータベースの話なんかも扱ってました。その後パッタリ更新が止まっていた理由を考えると、ズバリ本業が忙しかったからですね。春先は…

中国語学習×グラフデータベース(13) - 細々気づいたこと

一通りデータは登録してみたので、細々したことをいくつか。 重複ノードの削除 データを登録する際に、いろいろ間違えてしまい不要なノードを削除したいなという時があった。通常のリレーショナルDB(以下RDB)では、テーブル定義の時にキーの重複を許さないよ…

中国語学習×グラフデータベース(12) - 類義語間のリンク

前回、登録されていないキーワードを拾い集めたので、それをいったん単語として登録するところから再会。 新しい単語の自動新規登録 今回は、ある種機械的に拾い集めたものなので、単語の詳細は後回しにしつつ、自動登録だよという意味で、autoaddという属性…

中国語学習×グラフデータベース(11) - 類語を結びつける

ひとまず、単語(キーワード)の一部と短文をつなげるところまで来たので、今回は類義語どうしをつないでみる。 ネタ元はこれ CD付 どう違う?例文で覚える中国語類義語1000作者: 于鵬,平山邦彦,川田直樹出版社/メーカー: アスク出版発売日: 2010/04/28メディア…

中国語学習×グラフデータベース(10) - 単語と短文を紐付ける

今日のお題は、単語と短文のNodeを紐付けるのだが、いくつか考えるべきところがある。 Relationshipだらけに意味はあるか 中国語で一番使われている漢字はなんだろうか?ぶっちゃけ分からないけど、「我」「你」「是」「不」みたいな字は、登場頻度が高いよ…

中国語学習×グラフデータベース(9) - 属性変更

意外に続いている今シリーズ。ネタ切れも間近だったりするけど、とりあえずまとめておく。 属性の変更 例えば、単語1つを例に挙げる。 w = list(graph.find("Word", "keyword", "挨")) print(w) [<Node graph='http://localhost:7474/db/data/' ref='node/1110' labels={'Word'} properties={'keyword': '挨', 'pinyin': 'ai1', 'meaning': '', 'pinyinf': 'āi'}>]「挨」という単語を見てみると、意味(meaning…</node>

中国語学習×グラフデータベース(9) - 様々な検索

例えば、短文の中からキーワードを含むとか、特定の声調を含む単語みたいの検索するとなると、WHERE句でイコールしか使えないとかいう話では使い物にならない。さすがにCypherでもそのあたりは対応済みという事を整理しておきたい。 ○○で始まるシリーズ 例え…

中国語学習×グラフデータベース(8) - Relationshipの検索

検索という意味では前回とほとんど同じ。 Cypher独特の書式 独特と言っても、決して取っつきにくいわけではない。py2neoからはmatch()を使う方法もあるが、前回からの流れで、cypher.execute()で実行している。 wl = graph.cypher.execute("MATCH (w:Word)-[…

中国語学習×グラフデータベース(7) - ノードの検索

前回までで、ひとまず作ったデータがNeo4jの中に入ってきた。ここからいろいろデータをいじる訳だが、慣れる意味も含めていろいろのパターンで動かしてみることにする。 py2neoから直接cypherクエリを発行してみる 前回、py2neoの機能に頼りすぎて少し失敗し…

便利すぎるJupyter(IPython Notebook)に今頃気づく

Pythonをいじっていると、ソースを長々と書く段階に至る前に、ちょこちょこと数行程度で動きを試してみたいという事がよくある。エディターで保存して実行でも良いのだが、少々回りくどい。かといって、ターミナルから直接コードを入れると、1つ間違えばやり…

中国語学習×グラフデータベース(6) - ノードをまとめて作る

ついにNeo4jにデータを取り込む。 merge/merge_oneは使えるのか使えないのか まずは簡単そうな短文を取り込む。すでに、sentence_listというリストに短文は取り込んであるので、こんな感じでOK。 for sentence in sentence_list: graph.merge_one("Sentence"…