|
|
在admin5看到一篇文章是写站长原创防止采集的加密方法的文章,我认为比较不错,如果DT加上这个功能,小网站的原创文章知识产权得到有力保障,让DT客户稳定发展,不受大站欺负。更进一步拓展了DT客户群。
原文章摘录:
有的人问了,我花很多时间原创的文章,被别人采集了,我的站权重太低,采集我的那个站权重高,百度先收录了采集站的,那我这不是做了无用功么。这个其实不用担心,有方法让别人采集不了你的站,网上也提供了一些方法防止采集,像什么使用随机模板,安装防采集插件什么的,其实,这些方法只能对付一些低等级的采集者,一旦你碰上了写正则表达式的高手,那么这些方法将会是浮云,该被采还是被采,下面我分享一个方法来做到百分之百不会被采集,任你的正则表达式使用的出神入化,也拿我的站没辙。
这个方法就是进行网址加密,我们知道,正则表达式会匹配你列表页的超链接,然后通过超链接地址来获取你文章页的内容,而一旦你把列表页的超链接进行加密,这样就从源头掐断了采集者的路。加密函数如下:
function uc_authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
$ckey_length = 4; //note 随机密钥长度 取值 0-32;
//note 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。
//note 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方
//note 当此值为 0 时,则不产生随机密钥
$key = md5($key);
$keya = md5(substr($key, 0, 16));
$keyb = md5(substr($key, 16, 16));
$keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
$cryptkey = $keya.md5($keya.$keyc);
$key_length = strlen($cryptkey);
$string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
$string_length = strlen($string);
$result = '';
$box = range(0, 255);
$rndkey = array();
for($i = 0; $i 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
return substr($result, 26);
} else {
return '';
}
} else {
return $keyc.str_replace('=', '', base64_encode($result));
}
}
此函数会随机把地址加密成无序的字符串,而且每次都是不一样的,这样就无规律可言,也就无法用正则进行匹配
用法:如果你的列表页网址是$str=”http://www.xiaohao.net/list/1.html”,那么在php文件里,对变量进行加密$url = uc_authcode($url 'DECODE', '#$123');第三个参数是加入加密串而加大破解的难度,这样,在你的模板上的网址就是加过密的了,而当你要读取数据库的时候可以用uc_authcode($url 'ENCODE', '#$123');来进行解密,这样在php文件在进行读库操作的时候,就不会是加过密的地址,如此一来,就彻底解决了原创文章被采集的问题。 |
|