やったこと

webサービスを作るときに考えたことを垂れ流します

【PHP】simple_html_domで国情報をセットする

PHPの「simple_html_dom」でスクレイピングをするときに、国の情報をセットする。
こうすると相手のサイトから日本語ベースのhtmlが返ってくる可能性ある。

以下のような感じで「Accept-language」に日本語をセットしてアクセスをするとよい。
(「user_agent」はiPhoneを偽装してる)

$url = "https://hogehoge.net/";
$context = stream_context_create();
stream_context_set_params($context, array('header' => 'Accept-language: ja\r\n', 'user_agent' => 'Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53'));
$html = file_get_html($url, 0, $context);

国際的なサイトならば、日本人が来たと思って日本語のページを返してくれる。