• 1
  • 2
  • 3
  • 4
  • 5
阿里云应用开发 首 页  »  帮助中心  »  云服务器  »  阿里云应用开发
Tsar开源:淘宝内部系统监控工具
发布日期:2016-7-31 11:7:30

  1、Tsar介绍

  Tsar是淘宝的一个用来收集服务器系统与应用信息的采集报告工具,如收集服务器的系统信息(mem、cpu等),以及应用数据(nginx、swift等),收集到的数据存储在阿里云服务器磁盘上,可随时查询历史信息,也可将数据发送到nagios报警。

  Tsar能比较方便的增加模块,只需按照tsar的要求编写数据的采集函数与展现函数,就可把自定义的模块加入到tsar中。

  2、Tsar安装

  目前Tsar托管在github上,下载编译安装步骤:

  $git clone git://github.com/kongjian/tsar.git

  $cd tsar

  $make

  $make install

  安装后:

  (1)定时任务配置:/etc/cron.d/tsar,负责每分钟调用tsar执行采集任务;

  (2)日志文件轮转配置:/etc/logrotate.d/tsar,每个月会把tsar的本地存储进行轮转;

  (3)Tsar配置文件路径:/etc/tsar/tsar.conf,tsar的采集模块和输出的具体配置;

  (4)模块路径:/usr/local/tsar/modules,各个模块的动态库so文件;

  3、Tsar配置

  Tsar刚安装完,还没有历史数据,想要check是否正常,执行tsar -l,查看是否有实时信息输出如图1所示:

  

图1

  Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:

  (1)增加一个模块,添加 mod_ on 到配置文件中

  (2)打开或者关闭一个模块,修改mod_ on/off

  (3)output_stdio_mod 能够配置执行tsar时的输出模块

  (4)output_file_path 采集到的数据默认保存到的文件(如果修改的话需要对应修改轮转的配置/etc/logrotate.d/tsar)

  (5)output_interface 指定tsar的数据输出目的,默认file保存本地,nagios/db输出到监控中心/数据库中,这两个功能还需要结合其它配置,具体见后面

  4、Tsar使用

  (1)查看历史数据,tsar

  (2)-l/--list 查看可用的模块列表

  -(3)l/--live 查看实时数据,tsar -l --cpu

  (4)-i/--interval 指定间隔,历史,tsar -i 1 --cpu

  (5)--modname 指定模块,tsar --cpu

  (6)-s/--spec 指定字段,tsar --cpu -s sys,util

  (7)-d/--date 指定日期,YYYYMMDD或者n代表n天前

  (8)-C/--check 查看最后一次的采集数据

  (9)-d/--detail 能够指定查看主要字段还是模块的所有字段

  (10)-h/--help 帮助功能

  5、高级功能

  (1)输出到nagios

  配置: 首先配置output_interface file,nagios,增加nagios输出

  然后配置nagios服务器和端口,以及发送的间隔时间

  ####The IP address or the host running the NSCA daemon

  server_addr nagios.server.com

  ####The port on which the daemon is running - default is 5667

  server_port 8086

  ####The cycle of send alert to nagios

  cycle_time 300

  因为是nagios的被动监控模式,需要指定nsca的位置与配置文件位置

  ####nsca client program

  send_nsca_cmd /usr/bin/send_nsca

  send_nsca_conf /home/a/conf/amon/send_nsca.conf

  接下来指定哪些模块和字段需要进行监控,一共四个阀值对应nagios中的不同报警级别

  ####tsar mod alert config file

  ####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax;

  threshold cpu.util;50;60;70;80;

  (2)输出到Mysql

  配置: 首先配置output_interface file,db,增加db输出

  然后配置哪些模块数据需要输出

  output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

  然后配置sql语句发送的目的地址和端口

  output_db_addr console2:56677

  目的地址在该端口监听tcp数据,并且把数据入库即可,可以参照 tsar2db。

  6、模块开发

  Tsar的一个比较好的功能是能增加自己的采集,这时需要编写模块代码,编译成so文件即可。

  首先安装tsardevel,刚才安装的时候,如果执行make tsardevel,就会把模块开发的基本文件安装到系统 然后执行tsardevel ,就能在当前模块生成一个模块目录:

  [kongjian@v132172.sqa.cm4 tsar]$ tsardevel test

  build:make

  install:make install

  uninstall:make uninstall

  [kongjian@v132172.sqa.cm4 tsar]$ ls test

  Makefile  mod_test.c  mod_test.conf

  按照要求修改mod_test.c中的read_test_stats,set_test_record 完成后make;make install就完成新模块的配置文件和so的设置,执行tsar --test就能查看效果。

  此外也可以通过配置文件对自定义模块传递参数,方法是修改配置文件中的mod_test on myparameter 然后在mod_test.c中的read_test_stats函数中,通过parameter参数就可以获得刚才配置文件中的内容。