Atomフィードからデータを抽出
PHPとWebAPIで作るマッシュアップサイト。
前回の「グーグルニュース取得PHP」の例の解説の続き。
URLリクエストを投げた結果を見て、そこからxmlの構造を捉え、配列に取り込むデータを取捨選択していく。
今回はRSS形式ではなく、Atom形式となっているため、多少異なる。
因みに、GoogleがRSS形式でのニュース配信を止めたのは、RSS形式だと自由度が低い上に、バージョン管理などが曖昧だということらしい。
それだったら最初からAtom形式でやっておれば良かったなあ、とか思うが。
ということで、URLリクエストを投げたところからの続き。
Googleニュースから情報を取得する関数の説明(2)
Atom 形式フィードをsimplexml_load_string展開した例
Atomフィードを配列に入れると、色々出てくるが、必要なのは[entry]の下の配列になる。
最近はタイトル自体が長いので、タイトルと記事のURLだけでも十分な情報になる。
より詳しい内容は[content]に載っているので、通常は[description]のところに入れる。
ただGoogleニュースの場合は分量が多いし、単純に文字数で切り取れないのでリターン配列には入れていない。