서버 점검 목적은 장애 발생 전 사전 예방이 가장 중요하다고 생각한다.

또한, 장애 발생 시 어떤 프로세스에서 문제가 발생했는지 빠른 확인과 대처가 필요하기 때문에

평소 내가 관리하는 서버에 대해서 확실하게 파악하는 것이 중요.

 

해당 게시글에서는 간략한 주간체크리스트 정도라고 생각하자!

 

 

1. 파티션별 디스크 사용량 점검

df -h

 

2. 시스템 운용상황 점검 (CPU 사용량 체크)

top -d2

 

3. 메모리 사용량 점검

free -m

 

4. 실행 중인 프로세스 및 데몬점검 (프로세스 생성관계)

pstree

 

5. 서버 접속기록 확인

last

 

6. 서비스(데몬) 상태 확인

service sshd status
systemctl status sshd

 

7. 세션상태 (서비스 연결 상태 확인)

#어떤 호스트들과 어떤 서비스로 어떻게 연결되어 있는가를 확인하고 연결 상태 확인 가능
netstat -a

#현재 열려진 포트와 LISTEN 중인 포트 상태 확인 가능
netstat -atp | grep LISTEN

 

8. 리눅스 톰캣 로그 기록 삭제

#보통 일정 기간마다 로그가 자동 삭제되도록 설정되어 있지만 그렇지 않은 경우 수동으로 적정 기간 삭제

find *.log -mtime +90 -exec rm -f {} \;             #모든 90일 이전 .log 파일 삭제
find *.log -mtime +30 -exec rm -f {} \;             #모든 30일 이전 .log 파일 삭제

ll -l | grep 'catalina.*'                           #catalina.*파일만 잡아서 확인
find catalina.* -mtime +90 -exec rm -f {} \;        #모든 90일 이전 catalina 파일 삭제

 

9. ntp 서버 시간 동기화 확인

#대괄호는 삭제해주고 해당 부분에 ntp 서버 주소 입력
ntpdate -d [ntp 서버 주소] | tail -1

 

10. N일 전 변경된 파일 확인

#모든 경로에 대한 1일 전 변경된 파일 확인
find / -ctime -1 -ls | less

#현재 경로에서 하위 파일/디렉토리에 대한 1일 전 변경된 파일 확인
find ./ -ctime -1 -ls | less

 

11. 소유자 없는 파일 및 디렉토리 찾기

# 위와 같이 모든 경로에 대한 소유자 없는 파일 및 디렉토리 찾아준다
find / -nouser -o -nogroup -ls

 

12. 기타

cat /proc/cpuinfo                             #CPU 확인
grep -c processor /proc/cpuinfo               #CPU 전체 코어 수
grep "physical id" /proc/cpuinfo | sort -u    #물리적 CPU 개수

 

반응형