Pythonでスクレイピング
BeautifulSoupというライブラリを使ってみました。
BeaultifulSoup: http://www.crummy.com/software/BeautifulSoup/
なんと便利。
str = "<a href='#'>test</a>";
なんて文字列があったとすると,中身のtestだけ取り出したいときは以下のように書きます。
from bs4 import BeautifulSoup; str = "<a href='#'>test</a>"; soup = BeautifulSoup(str); print soup.a.string ##<a></a>の中身を表示
便利便利♪