Entries from 2013-07-12 to 1 day

あ、確率の話か (中国語の声調を推測してみる) その1

今から一ヶ月ぐらい前に、自分の持っている中国語単語DB(5800語ぐらい入っているはず)のデータをいじった話を記事にしました。Accessing Chinese word database Analysing Chinese words 2 Pick up combination of Pingyin and Chinese charactersこの単語DB…

Evaluation (6.3)

The Test Set (6.3.1) >>> import random >>> from nltk.corpus import brown >>> tagged_sents = list(brown.tagged_sents(categories='news')) >>> random.shuffle(tagged_sents) >>> size = int(len(tagged_sents) * 0.1) >>> train_set, test_set = tagg…