ブックマーク 2023年7月6日 EVEN スキュー Redshift DISTSTYLE

スキューのない世界を目指して - クックパッド開発者ブログ

スキューのない世界を目指して - クックパッド開発者ブログ

こんにちは。インフラストラクチャー部データ基盤グループの小玉です。 先日Amazon Redshift(以下、Redshift)で32TBのテーブルを全行スキャンするクエリを3本同時に走らせたまま帰宅し、クラスターを落としてしまいました。 普段はRedshiftのクエリをチューニングしたり、データ基盤周りの仕組みを慣れないRubyで書い...

はてなブックマーク - スキューのない世界を目指して - クックパッド開発者ブログ はてなブックマークに追加

girled girled Key方式の説明が参考。既存テーブルのDISTSTYLEをKEYからEVENにしたらサイズが1.5倍になったので謎って調べたんだけどKEYでまとまってたカラムがEVEN分散で非効率になる影響なのか