トップ «前の日(11-20) 最新 次の日(11-22)» 追記

kaztomo日記


2017/11/21

_ [Python]もういっちょ別の形態要素解析で wordcloud してみる

前回は Janome を使ったけど、MeCab を使う場合も試してみた。

見つけたサイト に従い、 「炎上案件に突如ディレクターとして投入されたときにやってみたこと 」を題材にして wordcloud を作ってみようとしたら、そのまま実行するとエラー (+_+)

  1. BeautifulSoup(res.text) で warning
  2. WordCloud 関数内で TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode' なるエラー

1 については、 第2引数として "lxml" を追加すれがOK。

2 については、strでなければ処理できないのに、unicode を指定していることが問題の様子。

でとりあえず、stop_words配列の文字列から u を削除して str化してみたら、エラーは無くなった (^o^)/ でも、 サイトに上がっている例 と、見た目が違う (>_<)

画像の説明

よくよく見ると、stopwords 指定している文字列が認識できていないみたい (>_<)

更にググってみたところ、 今回のエラーに遭遇している人 は他にもいたようで、 俺と同じ回避(解決)策を取ったけど、実行結果が載ってないから stopwords 問題がどうなっているかは不明 orz


参考にさせていただいたサイト: