훌륭하다. 7과 8은 호환이 안 된다. 이제 일래스틱 서치도 사용할 줄 아는 몸이 됐다.
클러스터를 내가 설치하고 운영하는 것이 아닌 사용자 입장이라 클러스터 운영 측면에서는 잘 모르겠다.
아무튼 클러스터 기반의 서비스 중에 가장 맘에 드는 툴이다.
인덱스를 통으로 잡으면 샤딩 분할이 어떻게 될 것인가?
내가 쓰는 데이터량 수준에서는 여전히 빠르다. 인덱스를 통으로 잡고 prefix 를 통한 족보화를 하는 것이 낫다.
복잡한 기능을 제공하는 한 편, 단순 기능으로 우회해도 목표를 달성한다.
nori 토크나이저 등을 시도할 수 있고 인제스트 시점에 인덱싱 상세 설정을 할 수 있다.
가장 빠른 접근법은 chatgpt 류를 통해서 진행하는 것이다. 문서를 읽고 구현하는 것 보다 더 빨리 목표를 달성한다.
굳이 구현체를 의존성을 쓰지 않아도 된다. 직접 json 콜로 구현하는 것이 명확하고 의존성 꼬임에서 자유롭다. 특히 7, 8 버전 문제가 좀 있었다.
아쉬운 점이라면 성능 향상을 위해 프로토버프라든가 바이너리 프로토콜 등을 지원했으면 좋을 뻔 했다.
인제스트도 현재는 스파크로 밀어넣고 있지만 파이핑이라든가 몇 가지 트릭이 있으면 더 좋을 것 같다. 제작자들은 벌크 데이터 입출력을 원하지 않았을 수도 있다. 데이터도 우와아앙아아아 들어오는 것 보다는 동-동-동-동 들어오는것이 빈 시간을 이용해서 어쩌고저쩌고 할 시간이 있다.