首页 » VPS 知识 » 浏览内容

VPS自动监控Shell脚本


2011-11-18 21:42:04 12,644 0 发表评论 字体: 作者:C.K.
标签: Shell脚本VPS自动监控

体验版 88 元,个人版 128 元,多用户版 288元个人版160元升级到多用户版。

该脚本用于监控VPS服务器负载,Web程序内存及CPU使用。当服务器系统负载或内存使用达到预设值,则重启该程序,或者某个php-cgi进程占用CPU过大,则直接kill掉该进程。目的在于缓解服务器资源耗尽导致意外宕机等情况。
嗯,没错。该脚本是此前 v1 的更新版本,考虑今后可能还会更新,故移到 github gist 进行简单的版本控制。

一、使用方法:

git clone git://gist.github.com/1216837.git gist-1216837
  • vi gist-1216837/sys-mon.sh //修改内存、CPU等预设阀值
  • mkdir /var/script
  • mv gist-1216837/sys-mon.sh /var/script
  • chmod a+x sys-mon.sh
  • 设置每分钟执行一次

    crontab -e
  • * * * * * /bin/bash  /var/script/sys-mon.sh
  • vi /usr/local/LuNamp/cmd/crontab_cmd.sh
  • * * * * * /bin/bash  /var/script/sys-mon.sh
  • 二、Shell脚本内容

    建议打开下面网址查看最新版本。

    https://gist.github.com/1216837

    以下适用于LUM:

    使用条件
  • 1.curl支持(Ubuntu用户直接 apt-get install curl)
  • 2.正确的Unix时间 (设置方法如下)
  • date -s 121120442011
  • #mmddhhmmyyyy
  • #月 天 小时 分钟 年
  • 1.vi /var/script/sys-mon.sh
  • 2.点键盘i键
  • 3.粘贴脚本内容(见帖子下方)
  • 4.点击ESC
  • 5.输入:wq 回车
  • 6.chmod +x /home/monitor.sh
  • 7.crontab -e
  • #! /bin/bash
  • #====================================================================
  • # sys-mon.sh
  • #
  • # Copyright (c) 2011, WangYan <webmaster@wangyan.org>
  • # All rights reserved.
  • # Distributed under the GNU General Public License, version 3.0.
  • #
  • # Monitor system mem and load, if too high, restart some service.
  • #
  • # See: https://wangyan.org/blog/sys-mon-shell-script.html
  • # Modify By wtCoder
  • # blog: http://blog.wtcoder.net/
  • # V 0.5.1, Date: 2011-12-11
  • #====================================================================
  • #  start
  • # 设置环境变量
  • PATH=/sbin:/bin:/usr/sbin:/usr/bin
  • # 监控进程名称
  • NAME_LIST="httpd nginx mysql php-cgi"
  • # 单个子进程的CPU占用百分比
  • PID_CPU_MAX="25"
  • # 单个程序所有进程内存占用百分比
  • PID_MEM_SUM_MAX="95"
  • # 最大系统负载限制
  • SYS_LOAD_MAX="6"
  • # 日志记录路径
  • LOG_PATH="/var/log/sys-mon.log"
  • # 日期格式化设置
  • DATA_TIME=$(date +"%Y-%m-%d-%H:%M:%S")
  • # 测试站点是否正常运行的url
  • MY_URL="http://xxx/"
  • # 程序控制脚本目录
  • CMD_PATH="/usr/local/LuNamp/cmd/"
  • # PHP-CGI控制目录
  • FPM_PATH="/usr/local/php_fcgi/sbin/php-fpm"
  • # 指定当前使用的服务器网卡
  • NETWORK_CARD="eth0"
  • # 通知邮件地址
  • EMAIL="xxx@139.com"
  • # 指定地址发送邮件通知
  • # 格式?mailTo=xxx@gmail.com&title=xxx&content=xxx
  • # get发送。内容言简意赅就好.
  • # SENDMAIL_URL="http://blog.wtcoder.net/mail/send_mail.php?";
  • #发送方式 0:系统mail 1:第三方代发
  • SENDMAIL_TYPE="0";
  • #=============================
  • # $1 string Monitor Name
  • # $2 string start OR stop
  • #=============================
  • proControle()
  • {
  •      OPERATION=$2
  •         case $1 in
  •         "php-cgi")
  •             ${FPM_PATH} ${OPERATION}
  •          ;;
  •         "mysql")
  •             ${CMD_PATH}mysql-${OPERATION}
  •         ;;
  •         "httpd")
  •             ${CMD_PATH}apache-${OPERATION}
  •         ;;
  •         "nginx")
  •             ${CMD_PATH}nginx-${OPERATION}
  •         ;;
  •     esac
  • }
  • for NAME in $NAME_LIST
  • do
  •     PID_CPU_SUM="0";PID_MEM_SUM="0"
  •     PID_LIST=`ps aux | grep $NAME | grep -v root`
  •     IFS_TMP="$IFS";IFS=$'\n'
  •     for PID in $PID_LIST
  •     do
  •         PID_NUM=`echo $PID | awk '{print $2}'`
  •         PID_CPU=`echo $PID | awk '{print $3}'`
  •         PID_MEM=`echo $PID | awk '{print $4}'`
  • #       echo "$NAME: PID_NUM($PID_NUM) PID_CPU($PID_CPU) PID_MEM($PID_MEM)"
  •        PID_CPU_SUM=`echo "$PID_CPU_SUM + $PID_CPU" | bc`
  •         PID_MEM_SUM=`echo "$PID_MEM_SUM + $PID_MEM" | bc`
  •         if [ `echo "$PID_CPU >= $PID_CPU_MAX" | bc` -eq 1 ];then
  •             #先尝试结束高占用的php-cgi子进程
  •            if [[ "$NAME" = "php-fpm" || "$NAME" = "httpd" ]];then
  •                 sleep 5
  •                 if [ `echo "$PID_CPU >= $PID_CPU_MAX" | bc` -eq 1 ];then
  •                     echo "${DATA_TIME}: kill ${NAME}($PID_NUM) successful (CPU:$PID_CPU)" | tee -a $LOG_PATH
  •                     kill $PID_NUM
  •                 fi
  •             else
  •                 echo "${DATA_TIME}: [WARNING!] ${NAME}($PID_NUM) cpu usage is too high! (CPU:$PID_CPU)" | tee -a $LOG_PATH
  •             fi
  •         fi
  •     done
  •     IFS="$IFS_TMP"
  •     SYS_LOAD=`uptime | awk '{print $(NF-2)}' | sed 's/,//'`
  •     SYS_MON="CPU:$PID_CPU_SUM------MEM:$PID_MEM_SUM------LOAD:$SYS_LOAD"
  • #   echo -e "$NAME: $SYS_MON\n"
  •    SYS_LOAD_TOO_HIGH=`awk 'BEGIN{print('$SYS_LOAD'>'$SYS_LOAD_MAX')}'`
  •     PID_MEM_SUM_TOO_HIGH=`awk 'BEGIN{print('$PID_MEM_SUM'>'$PID_MEM_SUM_MAX')}'`
  •     #仍然高负载 则开始重启主进程
  •    if [[ "$SYS_LOAD_TOO_HIGH" = "1" || "$PID_MEM_SUM_TOO_HIGH" = "1" ]];then
  •         proControle $NAME stop
  •         sleep 5
  •         for i in `seq 3`
  •                 do
  •                     if [ `pgrep $NAME | wc -l` = "0" ];then
  •                         echo "$DATA_TIME: Stop $NAME successful! ($SYS_MON)" | tee -a $LOG_PATH
  •                         break
  •                     else
  •                         echo "${DATA_TIME}: [WARNING!] Stop $NAME failed[$i]! ($SYS_MON)" | tee -a $LOG_PATH
  •                         pkill $NAME && killall $NAME
  •                     fi
  •         done
  •         proControle $NAME start
  •         sleep 5
  •         for ii in `seq 3`
  •                 do
  •                     if [ `pgrep $NAME | wc -l` != "0" ];then
  •                         echo "$DATA_TIME: Start $NAME successful!" | tee -a $LOG_PATH
  •                         break
  •                     else
  •                         echo "${DATA_TIME}: [WARNING!] Start $NAME failed[$ii]! ($SYS_MON)" | tee -a $LOG_PATH
  •                         proControle $NAME start
  •                         sleep 5
  •                     fi
  •         done
  •         if [ `pgrep $NAME | wc -l` != "0" ];then
  •             echo "${DATA_TIME}: [ERROR!] Start $NAME failed! ($SYS_MON)" | mail -s "Start $NAME failed" $EMAIL
  •         fi
  •     fi
  • done
  • STATUS_CODE=`curl -o /dev/null -s -w %{http_code} $MY_URL`
  • if [ "$STATUS_CODE" != "200" ];then
  •     sleep 3
  •     ipaddr=`ifconfig ${NETWORK_CARD} |grep "inet addr"| cut -f 2 -d ":"|cut -f 1 -d " "`
  •     STATUS_CODE=`curl -o /dev/null -s -w %{http_code} $MY_URL`
  •     if [ "$STATUS_CODE" != "200" ];then
  •         echo "${DATA_TIME}: [WARNING!] Website Downtime! ($SYS_MON)" | tee -a $LOG_PATH
  •         if [ "$SENDMAIL_TYPE" = "0"];then
  •             echo "${DATA_TIME}: [WARNING!] Website Downtime! ($SYS_MON)" | mail -s "Start $NAME failed" $EMAIL
  •         else
  •             TITLE="${DATA_TIME}--WARNING--IP:${ipaddr}--Website_Down"
  •             SEND_STATUS=`curl -o /dev/null -s -w %{http_code} ${SENDMAIL_URL}mailTo=${EMAIL}\&title=${TITLE}\&content=$SYS_MON`
  •             if [ "$SEND_STATUS" != "200" ];then
  •                 `curl -o /dev/null -s ${SENDMAIL_URL}mailTo=${EMAIL}\&title=${TITLE}\&content=$SYS_MON`
  •             fi
  •         fi
  •     fi
  • fi
  • 注意事项

    1、NAME_LIST 指定的监控程序必须在/etc/init.d 文件夹中存在,并且支持stop和start操作
    2、PID_CPU_MAX 指的是单个进程的CPU占用,只针对php-fpm或httpd。
    3、PID_MEM_SUM_MAX 指的是该程序所有进程实际内存占用,而并非系统总内存。
    4、EMAIL 只有在程序启动失败后,你才能收到邮件提醒。

    #! /bin/bash
  • #====================================================================
  • # sys-mon.sh
  • #
  • # Copyright (c) 2011, WangYan <webmaster@wangyan.org>
  • # All rights reserved.
  • # Distributed under the GNU General Public License, version 3.0.
  • #
  • # Monitor system mem and load, if too high, restart some service.
  • #
  • # See: https://wangyan.org/blog/sys-mon-shell-script.html
  • #
  • # V 2, since 2011-09-14
  • #====================================================================
  • # Need to monitor the service name
  • NAME_LIST="php-fpm mysql nginx"
  • # Single process to allow the maximum CPU (%)
  • PID_CPU_MAX="20"
  • # The maximum allowed memory (%)
  • SYS_MEM_MAX="90"
  • # The maximum allowed system load
  • SYS_LOAD_MAX="5"
  • # Log path settings
  • LOG_PATH="/var/log/autoreboot.log"
  • # Date time format setting
  • DATA_TIME=$(date +"%y-%m-%d %H:%M:%S")
  • # Your email address
  • EMAIL="webmaster@wangyan.org"
  • # Your website url
  • MY_URL="https://wangyan.org/blog"
  • #====================================================================
  • for NAME in $NAME_LIST
  • do
  •     SYS_CPU_SUM="0";SYS_MEM_SUM="0"
  •     PID_LIST=`ps aux | grep $NAME | grep -v root`
  •     IFS_TMP="$IFS";IFS=$'\n'
  •     for PID in $PID_LIST
  •     do
  •         PID_NUM=`echo $PID | awk '{print $2}'`
  •         PID_CPU=`echo $PID | awk '{print $3}'`
  •         PID_MEM=`echo $PID | awk '{print $4}'`
  • #       echo $NAME: $PID_NUM $PID_CPU $PID_MEM
  • #       SYS_CPU_SUM=`echo $SYS_CPU_SUM + $PID_CPU | bc`
  •        SYS_MEM_SUM=`echo $SYS_MEM_SUM + $PID_MEM | bc`
  •         if [[ "$NAME" = "php-fpm" && "$PID_CPU" > "$PID_CPU_MAX" ]];then
  •             echo "$DATA_TIME kill $PID_NUM successful (CPU:$PID_CPU)" | tee -a $LOG_PATH
  •             kill $PID_NUM
  •         fi
  •     done
  •     IFS="$IFS_TMP"
  •     SYS_LOAD=`uptime | awk '{print $(NF-2)}' | sed 's/,//'`
  •     MEM_COMPARE=`awk 'BEGIN{print('$SYS_MEM_SUM'>'$SYS_MEM_MAX')}'`
  •     LOAD_COMPARE=`awk 'BEGIN{print('$SYS_LOAD'>'$SYS_LOAD_MAX')}'`
  • #   echo -e "$NAME: CPU_SUM:$SYS_CPU_SUM MEM_SUM:$SYS_MEM_SUM SYS_LOAD:$SYS_LOAD\n"
  •     for ((i=0;i<3;i++))
  •     do
  •         STATUS_CODE=`curl -o /dev/null -s -w %{http_code} $MY_URL`
  •         if [ "$STATUS_CODE" = "200" ];then
  •             break
  •         fi
  •     done
  •     if [[ "$MEM_COMPARE" = "1" || "$LOAD_COMPARE" = "1" || "$STATUS_CODE" = "502" ]];then
  •         /etc/init.d/$NAME stop
  •         if [ "$?" = "0" ];then
  •             echo "$DATA_TIME Stop $NAME successful (MEM:$SYS_MEM_SUM CPU:$SYS_CPU_SUM LOAD:$SYS_LOAD)" | tee -a $LOG_PATH
  •         else
  •             echo "$DATA_TIME Stop $NAME [failed] (MEM:$SYS_MEM_SUM CPU:$SYS_CPU_SUM LOAD:$SYS_LOAD)" | tee -a $LOG_PATH
  •             sleep 3
  •             pkill $NAME
  •         fi
  •         /etc/init.d/$NAME start
  •         if [ "$?" = "0" ];then
  •             echo "$DATA_TIME Start $NAME successful" | tee -a $LOG_PATH
  •         else
  •             echo "$DATA_TIME Start $NAME [failed]" | tee -a $LOG_PATH
  •             echo "$DATA_TIME Start $NAME failed" | mail -s "Start $NAME failed" $EMAIL
  •         fi
  •     fi
  • done
  • 脚本内容不难理解,原理解释可参考《Linux 进程自动监控shell脚本》
    本文来自:
    https://wangyan.org/blog/sys-mon-shell-script.html
    http://www.sky.la/2010/12/linux-automatic-recovery-of-resources-to-handle-the-load-monitor-script.html

      网站统计 Statistics

      • 创建时间: 2005年1月3日 距今4973 天
      • 日志总数: 2461
      • 评论总数: 630
      • 标签总数: 654
      • 链接总数: 273
      • 最后更新: 2017-7-1 18:16:33
      • 您是本站第 13808066 位访客

      广告区 Guǎng Gào