目前我正在使用CURL来搜索网站.我想要可靠地获得标题,描述和关键字.
//Parse for the title, description and keywords
if (strlen($link_html) > 0)
{
$tags = get_meta_tags($link); // name
$link_keywords = $tags['keywords']; // php documentation
$link_description = $tags['description'];
}
唯一的问题是人们现在正在使用各种元标记,例如开放图形< meta property =“og:title”content =“The Rock”/>.它们也会大量改变标签< title> < TITLE>
我真的需要一些能够一致地提取这些变量的代码.如果有一些标题,关键字和描述,只要它能找到它.因为现在它似乎很受欢迎.
也许是一种将所有标题提取到标题数组中的方法?然后,抓取Web开发人员可以选择最佳记录在他们的数据库中.同样适用于关键字和描述.
This is not a duplicate. I have searched through stackoverflow and
nowhere is this solution to place all “title”, “keywords” and
“description” type tags into arrays.