Hive는..
인덱스가 없다. -> 다차원 파티션과 버켓(or 정렬된 버켓)으로 해결한다.
- 인덱스가 있긴 있다. -> 하지만, 제한된 기능으로 역시 다차원 파티션과 버켓(or 정렬된 버켓)으로 해결한다.
- 갱신, 삭제도 없다. -> 해당 파티션에 데이터를 overwrite함으로써 해결한다.
- 어떤 버전부터 지원되는지 모르겠지만, 0.8.0 버전은 create schema, create database 를 지원한다. 물론 use <database_name> 도 된다.
- 응답시간이 느리다. 적절한 곳에 적절히 써먹어야 한다.
- HiveQL이라고 ANSI-92와 닮은 쿼리언어를 지원한다. 생각보다 유연한듯..
- 인프라 운영자(hdfs)가 꼭 있어야 할 듯... 전기세 기타등등을 따지면 그리 싼비용도 아닌거 같음..