几种网站镜像的操作手法
什么是镜像
网站镜像就是网站的复制版本。因为网站是由很多网页组成的,将其中的一部分网页按原来的结构复制出来,就是一份镜像。比如,新浪在全国各地就有很多的镜像,他们和主站的版式,结构,功能都一样,只是在不同的服务器上而已。一般是个人网站的站长为自己的站做一个备份,
也就是说,一个站由于流量或其它原因访问不到时, 人们可以去其他一个一模一样的站看。
正规的镜像,有点类似CDN的说法,主站做后端,然后多个服务器进行镜像做前端,这样前端挂了,轮询,不影响后端的服务器。
那么外贸的镜像操作,就比较有点黑了,镜像竞争对手的网站,然后仿造对方的手法做优化,以获取排名,再对来路等进行判断跳转,达到对自己外贸网站的引流作用。
老农也做过这样的,不过我是比较彻底,直接对方网站站库打包走,然后SEMRUSH导出对应的排名的关键词,然后进行批量优化,达到窃取对方网站的效果。
镜像的手法有哪些
1 Nginx代理镜像
2 通过动态的脚本配合伪静态规则进行直接镜像
以上是我比较常用的,当然,肯定还有其他的镜像方法,不过我这里这是普及一下我最熟悉的操作手法。
Nginx镜像
1 安装nginx环境,也可以直接第三方的一键包,比如lnmp环境,AMH环境等。
AMH.sh的免费版本,或者收费版本,都有可视化的操作。
不过归于nginx代码来说,就是一句。
server
{
listen 80;
server_name www.affadsense.com;
location / {
proxy_pass http://bbs.aliyun.com/;
proxy_redirect off;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
这样的效果就是打开www.affadsense.com,显示的是bbs.affadsense.com的内容。
然后就是涉及到的一个缓存问题,因为不可能每一次访问,都重新再读取一下数据,缓存的话,可以提高我们的速度和效率。
因此。需要另外创建一些缓存的文件夹,和对应的缓存代码。
mkdir /home/cache/path -p #新建2个目录,放置缓存文件
mkdir /home/cache/temp -p
修改 /usr/local/nginx/conf/nginx.conf 新增以下代码,主要是缓存相关设置,请放置于 http{ ##这里 } 中,一般加在 log_format 上面或下面均可:
client_body_buffer_size 512k;
proxy_connect_timeout 5;
proxy_read_timeout 60;
proxy_send_timeout 5;
proxy_buffer_size 16k;
proxy_buffers 4 64k;
proxy_busy_buffers_size 128k;
proxy_temp_file_write_size 128k;
proxy_temp_path /home/cache/temp;
proxy_cache_path /home/cache/path levels=1:2 keys_zone=cache_one:500m inactive=7d max_size=30g;
#500m是内存占用,7d是7天无访问删除,30g是缓存占具硬盘空间
以下为虚拟主机配置文件,可另存成 .conf 放置于lnmp vhost 下面:
server
{
listen 80;
server_name www.affadsense.com; #主机名
location / {
proxy_cache cache_one;
proxy_cache_valid 200 304 3d; #正常状态缓存时间3天
proxy_cache_key $host$uri$is_args$args;
proxy_pass http://bbs.affadsense.com/; #反代的网站
proxy_redirect off;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
expires 10d; #默认10天缓存
access_log /home/wwwlogs/vpsmm.log access; #日志文件
}
}
点击几下网站,df -sh 命令,查看 /home/cache 目录大小,即可测试是否缓存成功。此脚本为前端全缓存,后端动态更新后,前端不会自动修改。可手动清理cache目录下文件。这个方法,可以用纯静态的形式来防CC,如果你的动态博客,受到CC攻击,可以尝试一下。
以下,部分摘抄自网络。
Nginx 字符串的替换
镜像的话,还需要配上字符串替换,需要配上nginx的模块
一个是nginx_substitutions_filter ,一个是nginx-subfilter-module
相关可以参考
http://www.361way.com/nginx-httpsubsmodule/2928.html
面板的镜像操作
这里简单点,我以amh.sh为例,安装过程见官网,我就不举例。
安装lngx的模块
然后创建一个环境。
最后进行镜像的操作。
然后直接进入模块,添加镜像的网站即可,并且本身已经搭配好了关键词替换模块,直接对着面板干就行了。
头部代码 可以插入你自己的判断来源跳转代码,底部可以放入统计代码等。
脚本上进行克隆
这样的脚本有一大堆,有开源的也有收费的,我自己用的比较频繁的是国外的几个PHP代码。
我会提供到论坛公开板块中,解压后,解压到网站的根目录即可。
然后直接浏览器打开 install目录 安装即可。
安装成功后,直接进入网站的后台。
然后add new site
输入我们要镜像的域名
然后选择Clones即可。
然后选择对应的域名,进行开始克隆的创建。
这种属于抓取到本地,所以比较耗时。
创建完毕后,就有一个Clone Link
我们对应打开就可以看到克隆的效果。
由于比较耗时,我就不等了,稍后这个脚本会分享到论坛公开版块。
脚本上进行镜像-sitecopy
SityCopy 4.1
这里是老毛子的,反正我看不懂,谷歌翻译一下就懂了。翻译后页面如下
我们对应填入网站和管理密码
然后点击开始 即可。
效果如图
脚本上进行镜像 - 曾经服务器上偷盗的一款别人卖的镜像脚本
这个安装比较复杂,好在有安装教程。
这里就不做细说,感兴趣的可以下载一看。
好像是之前对方卖的是上万元,所以拿到的时候压缩包也是这么命名的,时间比较久远,就不拿来示范了。
脚本上进行镜像 my1.4 镜像系统
来自广告中国的一个脚本高手分享。
使用很简单。
程序比较简陋,后台比较简.......洁(是的,非常的。。。。)
先建立管理员表(admin.sql),然后创建账号名和密码.
你可以在include/config.php中设置你的网站基本信息(网站后台也可以).
在include/config.inc.php中设置数据库信息
如果程序出现了排版问题,去目标站下载他们站的css文件,然后将css文件放到指定的文件夹里面.
效果还是不错。
就到这里了
还有一款更方便的PHP脚本镜像,印象里是入侵他们的demo站,打包走了源码,后来年前也有一位黑客大牛找我一起继续那个网站,不过网站漏洞也补了。
不过不知道存在硬盘哪里了,找不出来。
关于镜像,我是建议大家多熟悉nginx,用nginx最镜像,最简单。
不懂nginx,觉的麻烦的话,就安装下amh.sh,然后根据后面的面板提示,去安装。
就到这里了,不是什么很干货的的内容,主要普及一些我知道的简单的镜像方法。
码字不易,您的转发和赞赏是我的一大动力之一。
欢迎关注我的公众号,请爱护我,不要抄袭我。
欢迎加入我的论坛,与我们一起交流。
下面是加入小密圈/获取论坛邀请码购买渠道:
小密圈(入圈后私信圈主,看到会私信邀请码):
其他获取方式:
支付宝:
微信支付: