トップ «前の日記(2017/11/20) 最新 次の日記(2017/11/23)» 編集

kaztomo日記


2017/11/21 [長年日記]

_ [Python]もういっちょ別の形態要素解析で wordcloud してみる

前回は Janome を使ったけど、MeCab を使う場合も試してみた。

見つけたサイト に従い、 「炎上案件に突如ディレクターとして投入されたときにやってみたこと 」を題材にして wordcloud を作ってみようとしたら、そのまま実行するとエラー (+_+)

  1. BeautifulSoup(res.text) で warning
  2. WordCloud 関数内で TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode' なるエラー

1 については、 第2引数として "lxml" を追加すれがOK。

2 については、strでなければ処理できないのに、unicode を指定していることが問題の様子。

でとりあえず、stop_words配列の文字列から u を削除して str化してみたら、エラーは無くなった (^o^)/ でも、 サイトに上がっている例 と、見た目が違う (>_<)

画像の説明

よくよく見ると、stopwords 指定している文字列が認識できていないみたい (>_<)

更にググってみたところ、 今回のエラーに遭遇している人 は他にもいたようで、 俺と同じ回避(解決)策を取ったけど、実行結果が載ってないから stopwords 問題がどうなっているかは不明 orz


参考にさせていただいたサイト: