2017/11/21
_ [Python]もういっちょ別の形態要素解析で wordcloud してみる
前回は Janome を使ったけど、MeCab を使う場合も試してみた。
見つけたサイト に従い、 「炎上案件に突如ディレクターとして投入されたときにやってみたこと 」を題材にして wordcloud を作ってみようとしたら、そのまま実行するとエラー (+_+)
- BeautifulSoup(res.text) で warning
- WordCloud 関数内で TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode' なるエラー
1 については、 第2引数として "lxml" を追加すれがOK。
2 については、strでなければ処理できないのに、unicode を指定していることが問題の様子。
でとりあえず、stop_words配列の文字列から u を削除して str化してみたら、エラーは無くなった (^o^)/ でも、 サイトに上がっている例 と、見た目が違う (>_<)
よくよく見ると、stopwords 指定している文字列が認識できていないみたい (>_<)
更にググってみたところ、 今回のエラーに遭遇している人 は他にもいたようで、 俺と同じ回避(解決)策を取ったけど、実行結果が載ってないから stopwords 問題がどうなっているかは不明 orz
参考にさせていただいたサイト: