반응형
Vertica 네트워크 관련 오류 (네트워크 영향으로 인해 하나의 노드가 다운 될 때 vertica.log)
Vertica는 3대의 Cluster로 구성되어 있고, 그중 1번 노드 가(편의상 1번, 2번, 3번 노드로 지칭) 다운 되었다. 개발 서버이긴 하지만, 실제로 운영 중에 vertica.log 에서 네트워크 문제로 에러 난 경우가 여러 번 있었다.
원인 : 1번 노드의 리눅스 서버에 네트워크 재설정으로 인해 네트워크 재기동하면서, 1번 Vertica 노드가 다운됨.
참조 : Vertica는 Cluster 노드간 Health Check를 수행 하는대 약 8초간 응답이 없으면, K Safety 설정에 의해 노드를 다운 시킨다. (vertica spread 프로세스의 역할이다.)
해결 방법 : 보통은 다운된 노드를 재기동하면 해결된다.
1. admintools UI 에서 5. Restart Vertica on Host 메뉴로 진입해서 다운된 노드를 선택해서 restart 수행
2. 또는 CLI 를 통해 재기동을 하면 된다. admintools UI로 재기동이 안 될 경우 --force 를 입력 해주면 기동이 가능하다.
$ admintools -t restart_host -d [DB_NAME] - s [HOSTS] --force
ex) $ admintools -t restart_host -d TESTDB -s v_test_node0001 --force
반응형