允许Google Crawler爬行特定的作者页面

时间:2013-09-01 作者:drabello

我有一个WordPress网站,有数千注册用户。为每个用户创建一个配置文件页面。这些页面中的大多数都是低质量的,因为大多数用户不会用信息填充他们的个人资料,因此,我不希望搜索引擎为这些页面编制索引。然而,一些作者页面的质量很高。

目前我正在使用WordPress SEO 在作者页面中添加noindex元标记的插件,我知道我还可以阻止/Author/ robots中的目录。txt。但问题是,我想允许爬虫程序对那些特定的高质量作者页面进行爬网。

有什么想法吗?

1 个回复
最合适的回答,由SO网友:NickJAB 整理而成

我通常会问几个澄清问题,但我没有这样做的声誉,所以让我们看看我是否能给你一个可行的解决方案。我不知道您认为什么是高质量,但如果某些字段是完整的,您可以围绕设置的字段执行if/else语句。假设您在用户配置文件区域中创建了一些字段,这些字段是这些用户为职务和头衔填写的(出于示例的考虑,如果这两个字段都已填写,则这是一个很好的配置文件)。您可以通过以下方式访问这些字段:

$job = get_the_author_meta( \'job\' );
$title = get_the_author_meta( \'title\' );

if( empty( $job ) && empty( $title ) {
    $meta = \'<META NAME="ROBOTS" CONTENT="NOINDEX">\';
    echo $meta;
}
或者,您可以将整个内容包装在函数中的函数中。然后调用标头中的函数。

这将对其进行设置,以便在这两个字段都为空时添加meta标记。如果其中任何一个都填写了(或两者都填写),则不会。您可能需要修改逻辑以满足您的需要,但想法是:

决定高质量的构成要素,检索数据,编写规则,在不符合规则的情况下添加元标记

结束

相关推荐

Get Authors Role

我使用的是管理角色和2个自定义角色。关于作者。php我希望能够放置该用户的角色。我用这个在文本中引出角色$curauth = $wp_query->get_queried_object(); $user_id = $curauth->ID; $user = new WP_User( $user_id ); if ( !empty( $user->roles ) && is_array( $user->roles ) ) { f