スキューのない世界を目指して - クックパッド開発者ブログこんにちは。インフラストラクチャー部データ基盤グループの小玉です。 先日Amazon Redshift(以下、Redshift)で32TBのテーブルを全行スキャンするクエリを3本同時に走らせたまま帰宅し、クラスターを落としてしまいました。 普段はRedshiftのクエリをチューニングしたり、データ基盤周りの仕組みを慣れないRubyで書い...
girled Key方式の説明が参考。既存テーブルのDISTSTYLEをKEYからEVENにしたらサイズが1.5倍になったので謎って調べたんだけどKEYでまとまってたカラムがEVEN分散で非効率になる影響なのか