前言
从来没想过会有人开辟这种赛道,竟然有人把我的博客内容完全clone
下来。文字内容转换为繁体,然后完全复刻我的博客出来….
冷静下来思考,这其中究竟有什么利益?值得花一个域名的价钱来clone
我一个小站?而且还屏蔽大陆的IP访问,大陆直接404
利用部分文章,来获得Google、Bing搜索引擎的排名
盗版我的博客文章,为了后期的劣币驱逐良币
我写的太好了,就想留着看
从上面这些可获益情况来看,都是属于为了吃醋而包一顿饺子,虽然暂时想不明白,但还是得着手解决这个问题
落地过程
跟松哥聊天解闷时,他帮我找到了解决问题的思路以及别人的落地过程。在此处特别致谢一下,一起帮我解决了这个棘手问题
我: 有个人克隆了我的博客。。
我:这是出于啥目的😯
松哥:😀哇哦
松哥:我打开是404
我:dns被污染了?
我:不对,国内IP一访问就是404;国外IP一访问就是我的博客
松哥:搞不懂一点
我:但为啥盯着我的博客呢?难不成是我写的太好了,非得国外镜像一个?
松哥:😂好家伙,采集现在这么明目张胆了
我:而且不知道咋做到的,还原度这么高… 我理解
hexo g
后,在GitHub仓库里应该是纯html才对吧?他竟然能顺路翻译成繁体,还自动发布松哥:6666,确实,这个人怕是对你有点意思 哈哈哈
一段时间过后……….
松哥:https://yfzhu.cn/posts/1014/,https://xyzbz.cn/archives/1214/ 好像你站点也是这样,被恶意镜像了
解决方案
1. 增加跳转代码
验证该域名是否为localhost
、52xk.cc
,不是的话粗暴跳转到https://52xk.cc 即可
1 | <script> |
2. 向Google投诉
国外的搜索引擎中,Google是主要的搜索来源。玩这套的大概率也就图个Google搜索了,所以肯定收录了,直接举报这个域名即可
https://support.google.com/legal/answer/3110420
3. 启用防盗链
博客尽量屏蔽掉陌生的referer
,尤其静态资源。可在Gateway部分去做白名单限制,这里不做详细解释
4. 锁定IP,拉黑处理
找到相关爬取日志,拉黑IP处理即可,也是在Gateway下手即可
5. 最后的最后
收手吧兄弟,这条街上全是阿祖😅