日々を綴る。

主に日報。研究の話が多め。

4月18日 mon

進捗ゼミ#1

進捗ゼミではなすこと

  • どういう目的でやったのか
  • 今得た結果

を中心に話す。

ぴゅんちゃん

論文を読んだら、何が悪そうかを考える

  • 自分の論文を作るときに作りやすくするため
  • いちゃもんを付ける
  • 完璧な研究はない => 論文の穴を見つける
  • 例:ある一定の条件下では、これは成り立たない

論文にあるデータを使えば、自分で実験しないで引用(参照)してもいいこともある

わたし

研究のベース

  • Item2Vecよさそう
  • キーワード:協調フィルタリング、word2vec、ユーザIDありで進める
  • できればPOSだと嬉しいよね
  • 図書館のデータを使えたら嬉しそう

研究をするときの工夫

  • 自分の想像をふくらませていく
  • 例:アンケートでこの結果を得た人には、この結婚式場をすすめるとか
  • どこで応用するのか、制限を設けておこなってみたり
  • ここ必要じゃねって自分で考えてみる

そのたメモ

  • 来週、Item2Vecを詳細に説明する
  • 印刷した論文はすぐに見せられると便利
  • 日本の協調フィルタリングのすごい人:神嶌 敏弘(shimashima)
  • SVD、LDAについてはもっと理解を深める
  • 先生から頂いた授業資料(Dropboxに追加)
  • 図書館から本借りた

情報推薦システム入門 -理論と実践-

情報推薦システム入門 -理論と実践-


学校滞在時間

09:30 - 21:15


やったこと

ゼミ準備

  • 進捗報告メモ作成
  • 印刷

ゼミ

  • 上にまとめた

スクリプト書いた

  • ごりおしスクリプト()
  • Springer Link で使えるように書いた
  • めっちゃ簡単な内容だけど、久々にプログラム書いたなあ

gist.github.com

論文探し

  • Google Scholarで論文探し(今日は25本)
  • keyword
    • (5/5) collaborative filtering, word2vec transaction data
    • (2/2) collaborative filtering word2vec pos
    • (5/5) word2vec "instagram"
    • (11/13) collaborative filtering, word2vec [WIP]
    • ↑(落とせた論文数/探した論文数)


その他

落とそうと思う論文の基準がむつかしい

  • collaborative filtering, word2vec を検索すると、たぶん自然言語処理っぽいものが増えた
  • 結局そっち系じゃないのかどうなのかがわからなくて探しにくいなあという気持ち

ちょっと気になったこと

  • collaborative filtering, word2vec で検索するとSNS 関連のものが死ぬほど出てきた
  • サービスの性質上、ツイッターがめちゃくちゃ多い
  • けど今回word2vec だし、もっと短い単語レベルがいいなあと思って、instagram とかどうだろうと思って論文探した
  • word2vec "instagram" と検索すると、19件しかヒットしなかったので少ない
  • 参考:instagramハッシュタグという概念が強いので、こんな感じで単語で区切るタイプのSNS

f:id:marin72_com:20160418211214p:plain

引用:https://www.instagram.com/p/BDXx8GCrCuw/