Entries from 2013-07-09 to 1 day

結局NLTKで何をやりたいのか

この本の写経も気がつけば第6章に突入して、この本のボリュームからすると約半分というところまで消化してきています。入門 自然言語処理作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明出版社/メーカー: オライリージャパン発売日: …

Further Examples of Supervised Classification (6.2)

Sentence Segmentation (6.2.1) >>> sents = nltk.corpus.treebank_raw.sents() >>> tokens = [] >>> boundaries = set() >>> offset = 0 >>> for sent in nltk.corpus.treebank_raw.sents(): ... tokens.extend(sent) ... offset += len(sent) ... boundari…