본문 바로가기
카테고리 없음

Vertica DB 네트워크로 인한 노드 다운

by 쿡노트 2023. 6. 23.
반응형

Vertica 네트워크 관련 오류 (네트워크 영향으로 인해 하나의 노드가 다운 될 때 vertica.log)

Vertica는 3대의 Cluster로 구성되어 있고, 그중 1번 노드 가(편의상 1번, 2번, 3번 노드로 지칭) 다운 되었다. 개발 서버이긴 하지만, 실제로 운영 중에 vertica.log 에서 네트워크 문제로 에러 난 경우가 여러 번 있었다.

 

원인 : 1번 노드의 리눅스 서버에 네트워크 재설정으로 인해 네트워크 재기동하면서, 1번 Vertica 노드가 다운됨.

참조 : Vertica는 Cluster 노드간  Health Check를 수행 하는대 약 8초간 응답이 없으면, K Safety 설정에 의해 노드를 다운 시킨다. (vertica spread 프로세스의 역할이다.)

 

해결 방법 : 보통은 다운된 노드를 재기동하면 해결된다.

1. admintools UI 에서 5. Restart Vertica on Host  메뉴로 진입해서 다운된 노드를 선택해서 restart 수행

2. 또는 CLI 를 통해 재기동을 하면 된다. admintools UI로 재기동이 안 될 경우 --force 를 입력 해주면 기동이 가능하다.

$ admintools -t restart_host -d [DB_NAME] - s [HOSTS] --force

ex) $ admintools -t restart_host -d TESTDB -s v_test_node0001 --force

반응형