Learn Chinese

Pinyin Trainer (锻炼拼音) サポートページ (日本語)

News: 2013/9/25ついにリリースされました! ようこそ Pinyin Trainer サポートページへ ひとりの中国語学習者として、中国語を学ぶ上で最も難しいのは、発音を覚えることだと思っています。たとえ数年の中国語学習歴があったとしても、覚えたはずの発音、特…

EvernoteとGoogle Documentの中国語OCR機能を比べてみる その3 - JPEGで読み込み

懲りもせずこのシリーズが復活しているのには訳があります。前回、PDFファイルで比較した際には、Google Documentの圧勝という結果に終わったのですが、ふとJPEGで読み込んだらどうなるかという事が頭をよぎりました。Evernoteをお使いの方ならおわかりにな…

中国語OCRは他にもある

Google DocumentやEvernoteを使った中国語のOCRについて記事を書きましたが、他の選択肢はないかなと思って、"iOS Chinese OCR"的なキーワードでググってみると、Pleco SoftwareのOCRが結構良いというようなコメントをチラチラ見かけました。なんか聞いたこ…

EvernoteとGoogle documentのOCR機能を比べてみる(中国語) その2 - スキャナの解像度はあんまり関係ない

今回の記事は短いですし、役立つ情報はありません。ちょっとした続報だけです。前回、このお題で記事にしたときには、スキャナの解像度は(その機会でデフォルトの)300dpiで試して、Evernoteは残念ながら全滅、Google Documentは漢字の部分は、まあまあそこそ…

ピンインの変換 その2

前回書いたのは、内部的に保存されている(と仮定した)声調番号を後ろに付けたフォーマット(以下、保存用フォーマット)のピンインから、いわゆる表示用フォーマットに変換するロジックの話でした。一応、それとは逆のパターンも考えてみたいと思います。 どん…

ピンインの変換

日本人(だけじゃないかな?)が中国語学習をする上で一番大変なのは声調を覚えることというのは前にも書いたとおりです。そこで一生懸命覚えることになるのですが、例えば自分で電子的に単語帳を作る、それが本格的なDBだろうがExcelだろうが、ピンインの処理…

EvernoteとGoogle documentのOCR機能を比べてみる(中国語)

つい昨日のことなんですが、Google Documentに多言語OCR機能が付いてるという事を今更ながらに知ってしまいました。(苦笑)長年愛用しているEvernoteにも同様の機能がありますが、英語+日本語というように、英語とその他1言語しか選べないので、これまでは「E…

Filemaker to Python (5) - Updateを試す

Select, InsertときたらUpdateも試しておこうということで、コードを書いてみましたというお話です。 上書きのルール 既存のレコードをUpdateするにあたって、何かしらのルールを決めておく事は重要だと思いました。例えば単語のDBを例にすると、単語そのも…

Filemaker to Python (4) - Insertを試す

中国語学習のDBのプラットフォームとして、Filemakerを使ったのはいくつか理由があるのですが、大きかったのは当時WinとMac両方の環境を使っていた事と、途中からFilemaker Goが出てきたので、そのままiPadとかでも勉強できるかも(実際にはやらなかったので…

Filemaker to Python (4) - パターン検索

とりあえず文字化けというか文字が途切れる問題は回避でき、Filemakerのデータベースにアクセスする手順は整ったと言えそうです。Filemaker ODBCドライバ経由で使用できるSQLについては、この資料の中に書いてあります。ただ、今回は中国語の単語のデータベ…

Filemaker to Python (3) - 途切れた文字列

前回、PythonからFilemakerのテーブルにアクセスする事に成功はしたのですが、検索した文字列の2文字目以降が途切れてしまうという問題が発生しています。ちなみにODBC側でログを取るオプションを使っても何も吐き出されていませんでした。 ちょっと実験 Sel…

Filemaker to Python (2) - Python側の準備

前の記事の続きです。 pyODBCのインストール これは、ホントにそのままesay_installであっさり行きました。 $ easy_install pyodbc Searching for pyodbc Reading http://pypi.python.org/simple/pyodbc/ Reading http://code.google.com/p/pyodbc Reading h…

Filemaker to Python (1) - ODBCドライバを入れてみる

これまでとちょっと毛色の違う話と感じるかも知れませんが、これも技術ネタなのでここに書いておきたいと思います。 なぜいきなりこの話? 先日、中国語の単語のデータベースを持っているという話がありましたが、Filemaker Pro 12のデータベースに入ってい…

あ、確率の話か (中国語の声調を推測してみる) その2

引っ張った昨日の話の続きです。 どんなデータを作ったのか。 チラ見せするとこんな感じ。元となったデータは、ピンインを純粋な発音の部分(子音+母音)と4つある声調(あと軽声も)に分けてマトリックス状にしました。発音の種類は395種類あり、それぞれについ…

あ、確率の話か (中国語の声調を推測してみる) その1

今から一ヶ月ぐらい前に、自分の持っている中国語単語DB(5800語ぐらい入っているはず)のデータをいじった話を記事にしました。Accessing Chinese word database Analysing Chinese words 2 Pick up combination of Pingyin and Chinese charactersこの単語DB…