前言 提到数据同步就必然会谈到 rsync
,一般简单的服务器数据传输会使用 ftp/sftp
等方式,但是这样的方式效率不高,不支持差异化增量同步也不支持实时传输。针对数据实时同步需求大多数人会选择 rsync+inotify-tools
的解决方案,但是这样的方案也存在一些缺陷(文章中会具体指出),sersync
是国人基于前两者开发的工具,不仅保留了优点同时还强化了实时监控,文件过滤,简化配置等功能,帮助用户提高运行效率,节省时间和网络资源。
可靠高效的数据实时同步方式
更新历史 2015 年 08 月 14 日 - 更新 GitHub 源码安装包 2015 年 08 月 13 日 - 初稿
阅读原文 - https://liaojiaxin158.github.io/post/sersync/
扩展阅读
基于 rsync+sersync 的服务器文件同步实战 - http://www.markdream.com/technologies/server/syncfile-by-rsync.shtml 通过 rsync sersync 实现高效的数据实时同步架构 - https://www.cnhzz.com/rsync_sersync/ Rsync+sersync 实现数据实时同步 - http://www.cnblogs.com/wjoyxt/p/4581410.html rsync - https://rsync.samba.org/ inotify-tools - https://github.com/rvoicilas/inotify-tools sersync - http://code.google.com/p/sersync/
原理
Synchronize files and folders between servers -using inotiy and rsync with c++ 服务器实时同步文件,服务器镜像解决方案
sersync
主要用于服务器同步,web 镜像等功能。基于 boost1.43.0,inotify api,rsync command. 开发。目前使用的比较多的同步解决方案是 inotify-tools+rsync
,另外一个是 google 开源项目 Openduckbill
(依赖于 inotify- tools),这两个都是基于脚本语言编写的。相比较上面两个项目,本项目优点是:
sersync 是使用 c++ 编写,而且对 linux 系统文件系统产生的临时文件和重复的文件操作进行过滤(详细见附录,这个过滤脚本程序没有实现),所以在结合 rsync 同步的时候,节省了运行时耗和网络资源。因此更快。
相比较上面两个项目,sersync 配置起来很简单,其中 bin 目录下已经有基本上静态编译的 2 进制文件,配合 bin 目录下的 xml 配置文件直接使用即可。
另外本项目相比较其他脚本开源项目,使用多线程进行同步,尤其在同步较大文件时,能够保证多个服务器实时保持同步状态。
本项目有出错处理机制,通过失败队列对出错的文件重新同步,如果仍旧失败,则按设定时长对同步失败的文件重新同步。
本项目自带 crontab 功能,只需在 xml 配置文件中开启,即可按您的要求,隔一段时间整体同步一次。无需再额外配置 crontab 功能。
本项目 socket 与 http 插件扩展,满足您二次开发的需要。
针对上图的设计架构,这里做几点说明,来帮助大家阅读和理解该图
1 ) 线程组线程
是等待线程队列的守护线程,当事件队列中有事件产生的时候,线程组守护线程就会逐个唤醒同步线程。当队列中 Inotify 事件较多的时候,同步线程就会被全部唤醒一起工作。这样设计的目的是为了能够同时处理多个 Inotify 事件,从而提升服务器的并发同步能力。同步线程的最佳数量 = 核数 x 2 + 2。 2 ) 那么之所以称之为 线程组线程
,是因为每个线程在工作的时候,会根据服务器上新写入文件的数量去建立子线程,子线程可以保证所有的文件与各个服务器同时同步。当要同步的文件较大的时候,这样的设计可以保证每个远程服务器都可以同时获得需要同步的文件。 3 ) 服务线程的作用有三个:
处理同步失败的文件,将这些文件再次同步,对于再次同步失败的文件会生成 rsync_fail_log.sh 脚本,记录失败的事件。
每隔 10 个小时执行 rsync_fail_log.sh 脚本一次,同时清空脚本。
crontab 功能,可以每隔一定时间,将所有路径整体同步一次。
4 ) 过滤队列
的建立是为了过滤短时间内产生的重复的 inotify 信息,例如在删除文件夹的时候,inotify 就会同时产生删除文件夹里的文件与删除文件夹的事件,通过过滤队列,当删除文件夹事件产生的时候,会将之前加入队列的删除文件的事件全部过滤掉,这样只产生一条删除文件夹的事件,从而减轻了同步的负担。同时对于修改文件的操作的时候,会产生临时文件的重复操作。
角色
注意主从配置的区别,记得调整 SELinux 和防火墙
iptables 配置实践 - https://liaojiaxin158.github.io/post/iptables/ LTMP 手动编译安装以及全自动化部署实践 - https://liaojiaxin158.github.io/post/ltmp/
服务器 A(主服务器)
服务器 B(从服务器 / 备份服务器)
rsync 默认 TCP 端口为 873
服务器 B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 cd /app/local wget http://rsync.samba.org/ftp/rsync/src/rsync-3.1.1.tar.gz tar zxf rsync-3.1.1.tar.gz cd rsync-3.1.1./configure make && make install vi /etc/rsyncd.conf uid=root gid=root max connections=36000 use chroot=no log file=/var/log /rsyncd.logignore errors = yes read only = no auth users = rsync secrets file = /etc/rsync.pass [rsync] comment = rsync path=/app/data/site/ [img] comment = img path=/app/data/site/img echo "rsync:rsync" > /etc/rsync.passchmod 600 /etc/rsyncd.conf chmod 600 /etc/rsync.pass rsync --daemon netstat -an | grep 873 lsof -i tcp:873 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME rsync 31445 root 4u IPv4 443872 0t0 TCP *:rsync (LISTEN) rsync 31445 root 5u IPv6 443873 0t0 TCP *:rsync (LISTEN) echo "/usr/local/bin/rsync --daemon" >> /etc/rc.localpkill rsync /usr/local /bin/rsync --daemon
服务器 A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 cd /app/local wget http://rsync.samba.org/ftp/rsync/src/rsync-3.1.1.tar.gz tar zxf rsync-3.1.1.tar.gz cd rsync-3.1.1./configure make && make install cd /app/local wget http://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz tar zxf inotify-tools-3.14.tar.gz cd inotify-tools-3.14./configure --prefix=/app/local /inotify make && make install cd /app/local wget https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz tar zxf sersync2.5.4_64bit_binary_stable_final.tar.gz mv /app/local /GNU-Linux-x86/ /app/local /sersync cd /app/local /sersyncecho "rsync" > /app/local /sersync/user.passchmod 600 /app/local /sersync/user.pass vi /app/local /sersync/confxml.xml
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 <? xml version="1.0" encoding="ISO-8859-1" ?> <head version ="2.5" > <host hostip ="localhost" port ="8008" > </host > <debug start ="true" /> <fileSystem xfs ="false" /> <filter start ="false" > <exclude expression ="(.*)\.php" > </exclude > <exclude expression ="^data/*" > </exclude > </filter > <inotify > <delete start ="true" /> <createFolder start ="true" /> <createFile start ="false" /> <closeWrite start ="true" /> <moveFrom start ="true" /> <moveTo start ="true" /> <attrib start ="false" /> <modify start ="false" /> </inotify > <sersync > <localpath watch ="/home/" > <remote ip ="8.8.8.8" name ="rsync" /> </localpath > <rsync > <commonParams params ="-artuz" /> <auth start ="true" users ="rsync" passwordfile ="/app/local/sersync/user.pass" /> <userDefinedPort start ="false" port ="874" /> <timeout start ="false" time ="100" /> <ssh start ="false" /> </rsync > <failLog path ="/tmp/rsync_fail_log.sh" timeToExecute ="60" /> <crontab start ="false" schedule ="600" > <crontabfilter start ="false" > <exclude expression ="*.php" > </exclude > <exclude expression ="info/*" > </exclude > </crontabfilter > </crontab > <plugin start ="false" name ="command" /> </sersync > <plugin name ="command" > <param prefix ="/bin/sh" suffix ="" ignoreError ="true" /> <filter start ="false" > <include expression ="(.*)\.php" /> <include expression ="(.*)\.sh" /> </filter > </plugin > <plugin name ="socket" > <localpath watch ="/home/demo" > <deshost ip ="210.36.158.xxx" port ="8009" /> </localpath > </plugin > <plugin name ="refreshCDN" > <localpath watch ="/data0/htdocs/cdn.markdream.com/site/" > <cdninfo domainname ="cdn.chinacache.com" port ="80" username ="xxxx" passwd ="xxxx" /> <sendurl base ="http://cdn.markdream.com/cms" /> <regexurl regex ="false" match ="cdn.markdream.com/site([/a-zA-Z0-9]*).cdn.markdream.com/images" /> </localpath > </plugin > </head >
1 2 3 4 5 6 7 8 nohup /app/local /sersync/sersync2 -r -d -o /app/local /sersync/confxml.xml >/app/local /sersync/rsync.log 2>&1 & nohup /app/local /sersync/sersync2 -r -d -o /app/local /sersync/img.xml >/app/local /sersync/img.log 2>&1 & -d: 启用守护进程模式 -r: 在监控前,将监控目录与远程主机用 rsync 命令推送一遍 -n: 指定开启守护线程的数量,默认为 10 个 -o: 指定配置文件,默认使用 confxml.xml 文件
GitHub 源码仓库 1 2 3 4 file://E:\sersync (0 folders, 3 files, 1.88 MB, 1.88 MB in total.) inotify-tools-3.14.tar.gz 350.36 KB rsync-3.1.1.tar.gz 869.26 KB sersync2.5.4_64bit_binary_stable_final.tar.gz 710.24 KB
sersync - https://github.com/liaojiaxin158/sersync