Text Mining Maniax[word2vec編]:RとRMeCabによる日本語の単語埋め込みの基礎

後藤和智事務所OffLine
フリーソフト「R」とそのパッケージ「RMeCab」などを用いて、自然言語処理の一分野であるword2vecに親しむための同人誌です。
【目次】はじめに第1章word2vecとは何か1.1そもそもword2vecとは?1.2word2vecの背景:WordEmbedding(単語埋め込み)とは何か?1.3word2vec作成のモデル1.4そもそも自然言語処理とは?1.5word2vecの問題点と、より発展的なモデル第2章RMeCabの導入と操作2.1Rの導入2.2MeCab・RMeCabの導入2.3RMeCabの基本的な操作2.3N-gramの頻度を分析する2.4フォルダの中にある複数のファイルに対する分析第3章RとRMeCabでword2vecをつくる3.1はじめに3.2分かち書き3.3前処理からword2vecの作成へ3.4word2vecで近い意味の単語を調べる