IT研究(修士)

IT研究(修士)

類似文書を検索してネットワーク図を生成する

イイ感じに研究が完了したので、白々しく「あらすじ」を説明した上で、提案法として開発した可視化ブラウジングツールを解説します。あらすじ訳あって「ゆるキャラ」に関する文書を探していました。その結果、1件の...
IT研究(修士)

WordNetで文書群のラベル推定をしてみた

最近の研究を調べていたら下記研究を見つけました。単語の分散表現を用いた文書群のラベル推定文書データはlivedoorニュースコーパスを使っています。SVMで各カテゴリーの重要語を割り出して、その重要語...
IT研究(修士)

分類精度が低いカテゴリーの分析

前回は、livedoorニュースコーパスの文書データセットをK近傍法で分類しました。K近傍法での分類結果その分類結果が上記となったのですが、分類精度が低いものが幾つかあります。73%:dokujo-t...
IT研究(修士)

livedoorニュースコーパスをK近傍法で文書分類する

前回は各文書を分かち書きして単語辞書と単語出現頻度表を作成しました。今回は、各文書ごとのTF-IDFベクトルからコサイン類似度を計算し、その値を用いてK近傍法で文書分類します。TF-IDF概念TF-I...
IT研究(修士)

文書データセットから単語辞書を作成する

大学院では、文書検索に関する研究をすることになりましたが、大規模データ分析は全く経験がないので、進捗状況を見直せるよう記事にまとめておこうと思います。なお、移籍することになった研究室はC言語をメインに...
タイトルとURLをコピーしました