ビッグデータ
2022-09-01 (木) 23:56:27
ビッグデータ とは †
- 大容量で多様なデータの集合体
- 「3つのV」を持つのが特徴
- Variety(データ種が多様)
- Volume(データ量が膨大)
- Velocity(データの発生速度、発生頻度が高い)
関連するソフトウェア(OSS) †
データ収集・検知・取込 †
クローラ †
データロード †
収集 †
CEP(complex event processing) †
- Apache S4
- Apache Spark Streaming
- Apache Storm
- Esper
- Drools Fusion
データ蓄積 †
データ蓄積(ファイルシステム) †
- Apache Hadoop HDFS
- Ceph
- GlusterFS
- Lustre
データ処理 †
並列分散処理 †
準リアルタイムクエリ †
データロード †
高速化キャッシュ・スケールアウト(NoSQL) †
データ分析 †
機械学習 †
深層学習 †
- TensorFlow
- CNTK -Microsoft
- DSSTNE -Amazon