Apache Hive

2021-11-14 (日) 12:01:48

Apache Hive

  • Hadoop上で動作するDBMS
  • バッチ型のクエリエンジン
  • バッチ型のデータ処理向け
  • HiveQLというSQLライクなクエリを使う。
  • 分散データ処理
  • OSS
  • SQL on Hadoop

実装

  • データの保存先
    • /user/hive/warehouse
  • デフォルトのDBMS
  • Hiveメタストア作成
    • schematool -initSchema -dbType derby
  • Hiveメタストアサービス起動
    • hive --service metastore
  • hive-site.xml
    • hive.metastore.uris
      • thrift://localhost:9083

Hiveを高速化するためのソフトウェア

関連用語