2017-11-14

pandasでいらない値を削除するためのチートシート

やりたいこと

  • Webスクレイピングしてきた後に、データをクリーニングする
  • その際、特定の文字列を含んだ行を削除したい

Pandasでいらない行を削除する方法

(1) ある列に特定の値を含んでいるものを削除(titleでルンバという値を含んだものを削除する)


df = df[df.title.str.contains("ルンバ") == False]

(2)ある列に特定の値を含んでいないものを削除(titleでルンバという値を含んでいないものを削除する)

df = df[df["title"].str.contains("ルンバ")==True]


注目の投稿

 PythonのTweepyを利用して、Twitter APIを利用している。 その中で、ハマったポイントをメモしておく。 まず、Searchに関して。 Twitter検索は、クライアントアプリ側では、全期間の検索が可能になっている。 一方で、APIを利用する際は、過去1週間しか...