kaztomo日記(11-21[長年日記])

2017/11/21

_ [Python]もういっちょ別の形態要素解析で wordcloud してみる

前回は Janome を使ったけど、MeCab を使う場合も試してみた。

見つけたサイトに従い、「炎上案件に突如ディレクターとして投入されたときにやってみたこと」を題材にして wordcloud を作ってみようとしたら、そのまま実行するとエラー (+_+)

BeautifulSoup(res.text) で warning
WordCloud 関数内で TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode' なるエラー

1 については、第2引数として "lxml" を追加すれがOK。

2 については、strでなければ処理できないのに、unicode を指定していることが問題の様子。

でとりあえず、stop_words配列の文字列から u を削除して str化してみたら、エラーは無くなった (^o^)/ でも、サイトに上がっている例と、見た目が違う (>_<)

画像の説明

よくよく見ると、stopwords 指定している文字列が認識できていないみたい (>_<)

更にググってみたところ、今回のエラーに遭遇している人は他にもいたようで、俺と同じ回避（解決）策を取ったけど、実行結果が載ってないから stopwords 問題がどうなっているかは不明 orz

参考にさせていただいたサイト：