StoryEdit 開発日誌

ウェブアプリ StoryEditを作ってましたが延期。普通のブログ。

Pythonでスクレイピング

BeautifulSoupというライブラリを使ってみました。
BeaultifulSoup: http://www.crummy.com/software/BeautifulSoup/


なんと便利。

str = "<a href='#'>test</a>";

なんて文字列があったとすると,中身のtestだけ取り出したいときは以下のように書きます。

from bs4 import BeautifulSoup;

str = "<a href='#'>test</a>";
soup = BeautifulSoup(str);
print soup.a.string ##<a></a>の中身を表示


便利便利♪