【PHP】simple_html_domで国情報をセットする
PHPの「simple_html_dom」でスクレイピングをするときに、国の情報をセットする。
こうすると相手のサイトから日本語ベースのhtmlが返ってくる可能性ある。
以下のような感じで「Accept-language」に日本語をセットしてアクセスをするとよい。
(「user_agent」はiPhoneを偽装してる)
$url = "https://hogehoge.net/"; $context = stream_context_create(); stream_context_set_params($context, array('header' => 'Accept-language: ja\r\n', 'user_agent' => 'Mozilla/5.0 (iPhone; CPU iPhone OS 7_0 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) Version/7.0 Mobile/11A465 Safari/9537.53')); $html = file_get_html($url, 0, $context);
国際的なサイトならば、日本人が来たと思って日本語のページを返してくれる。