#!/bin/bash load=`uptime` shijian=`date +%Y-%m-%d-%T` file=cpustatus.txt touch $file all=`cat $file |wc -l` printf "$load $shijian\n" >> $file
if [[ $all > 60 ]] ; then starttime=`cat $file |awk '{print $13}'|sort -r|tail -1` stoptime=`cat $file |awk '{print $13}'|sort -n|tail -1` loadavg=`cat $file |awk '{avg1+=$10;avg2+=$11;avg3+=$12}END{print avg1/NR,avg2/NR,avg3/NR}'` high=`cat $file |awk '{print $10}'|sort -n|tail -1` low=`cat $file |awk '{print $10}'|sort -r|tail -1` printf "$starttime \n load average $loadavg \n high $high \n low $low \n $stoptime \n\n" > j #printf "load average $startus \n" >>j #mv $f $f.$b fi
在配合 Crontab 使用更佳
下面是另外一個人寫的,也分享下
#!/bin/bash #提取本服務器的IP地址信息 IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "` #提取本服務器CPU數量 cpu_num=`grep -c 'model name' /proc/cpuinfo` count_uptime=`uptime |wc -w` #當前系統15分鐘的平均負載值 load_15=`uptime | awk '{print $'$count_uptime'}'` #獲取當前系統單個核心15分鐘的平均負載值,結果小于1.0時前面個位數補0 average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc` #取上面平均負載值的個位整數 average_int=`echo $average_load | cut -f 1 -d "."` #獲取執行shell輸入的警告值(0-100以內) warn_input=$1 if [[ ! $warn_input =~ ^[0-100]+$ ]] then exit 0 else if [[ "$warn_input" -lt 0 || "$warn_input" -gt 100 ]] then exit 0 else load_warn=$(($warn_input/100)) fi fi if [ $average_int -gt 0 ] then echo "$IP服務器單個核心15分鐘的平均負載為$average_load,超過警戒值1.0,請立即處理!!!$(date +'%Y-%m-%d %H:%M:%S')" else load_now=`expr $average_load \> $load_warn` if [ $load_now -eq 1 ] then echo "$IP服務器單個核心15分鐘的平均負載為$average_load,超過警戒值0.7,請立即處理!!!$(date +'%Y-%m-%d %H:%M:%S')" else echo "$IP服務器單個核心15分鐘的平均負載值為$average_load,cpu核心數為$cpu_num,系統15分鐘的平均負載為$load_15 負載正常 $(date +'%Y-%m-%d %H:%M:%S')" fi fi
|