生まれ変わるSnowflakeの挑戦

Snowflakeの将来性

現在のIT企業で最も注目されているのは、Snowflakeだと言えるだろう。2020年9月のIPO(株式公開)頃は$120くらいだったのが、一時期は$400ドルにまで達した。そして現在(2020年6月)は再び、$120くらいに落ち着いている。

このSnowflakeは、Hadoopの二の舞になるとか、しょせんデータ流通企業に過ぎないとかいう評価がある一方で、第二のAmazon AWSクラウドのようになると予想する人もいる。

これはいずれも適切な表現ではなくて、「今のところはデータ分析者が標準的に利用するクラウドになる可能性がある」という表現が正しい。

ただしこの表現も抽象的で分かりにくい。そこで今回は、どうしてそのような表現になるのか解説させて頂くことにする。

今までのSnowflake

2018年だけれども、IT技術者にはお馴染みのSlideshare.netにアーキテクチャ紹介資料を掲載して下さった方がいる。この資料が大変に分かりやすい。

昔は大ブームを起こしてから落ち着いたHadoopやSparkといった大規模データの処理を発展かつ後退させたような形で、Snowflakeの基本アーキテクチャが考案された。Oracle RACを開発した強者たちが、Amazon AWSのEC2コンピュートやS3オブジェクト・ストレージを土台に開発したといえば、分かる者には分かる。

「古(いにしえ)のOracle RACじゃ、今は通用しないんじゃない?」という方には、マルチクラスタ・ノード方式というキーワードを紹介したい。つまり大規模データには向かないOracle RACのアーキテクチャ概念を、複数クラスタ構成による集合体というコンセプトによって、大規模データに向いた形態へ生まれ変わらせたのだ。

僕は基本的に元OS屋なので専門外だけれども、ここ数年は「結局のところ、データ分析はSQLが基本になるのかなあ…」と眺め続けている。Sparkも最終的にはSpark SQLが考案されたし、IBMの2021年投資家向け説明会などで主要テーマに取り上げたIntelligent Data Fabric構想ではAutoSQL開発が宣伝されていた。

もちろんTableauなどのETLツールとやらによる表示も役立つけれども、大量データを分析するための呪文であっても、SQLが最有力になるような気がしているのだ。Snowflakeもデータ分析組織やデータサイエンティスト向けに、SQL機能を提供している。

ちなみに大規模データではないけれども、CRM (Customer Relationship Management) に特化したのがSalesforceというSaaSサービスだ。これは顧客の受発注データなどの管理を得意としており、基本的にAmazon AWS上で稼働している。

プログラミングのことを知らない素人でも、Salesforceを使えば顧客データ管理システムを構築できる。現在は守備範囲が会社の金勘定全体に広がり、会計システムとしても利用可能になっている。

これとは対照的にデータ種類は問わないけれども、ともかく大規模データをAmazon S3に構築されたSnowflakeデータレイクへ投げ込んで、SQLで分析処理をできるようにしたのがSnowflakeだ。最近ではAWSだけでなく、Microsoft AzureやGoogle GCPでも動作するようになり、同時にExternal Tables機能によってAWS S3、Azure Blob Storage、Google Cloud Storageを外部参照できるようになっている。

基幹システムの業務用データをデータレイクへ投げ込むのは一手間かかるけれども、そこはData Integrationツールと呼ばれるInformaticaなどが活躍してくれる。それにクラウド特有の「容易な操作性」も実現され、Snowflakeは大人気となった。

なお余談ながら発音に関して紹介しておくと、Salesforceは「セールスフォース」と発音し、SQLは「シークル」と発音する。ここら辺でIT技術者であるかどうかが識別できてしまうので、発音には注意すると良いだろう。

生まれ変わるSnowflake

さてクラウド時代のツボを押さえて一気にブレークしたSnowflakeだけども、ちょっとブレークし過ぎてしまった。冒頭画像はIPO後の株価推移だけれども、IPO公開直後には200ドルを超え、2回ほど400ドルレベルまで上昇した。

何しろ投資アナリストの予想を倍以上も超える売上成長を叩き出したりしたものだから、投資家たちが過激に反応してしまった。で、それに釣られるように、IT業界のエラいさんたちも騒いでしまった。Snowflakeのことを知らないから「夢」を持ち、売上が投資アナリストの予想通りに近い結果となるようになったら、「これじゃない」と株価下落が始まった。

いや、そもそも年間売り上げが$2Bに行くかなあ… というレベルのスタートアップ(ベンチャー)段階に近い企業に、400ドルは期待し過ぎであるような気もする。一時期は現CEOがCEOを務めていたServiceNowという先進企業の時価総額を超えてしまった。

で、現在はIPO時点の100ドル近いレベルで落ち着いている訳だけれども、投資家たちは夢を捨てきれない。「お前(Snowflake経営幹部)たち、もっと売上を伸ばせ」と言って来た。逆らえば、もちろん経営幹部の不信任成立 = 解雇である。

そうなると、CEOを始めとするSnowflake経営幹部が取れる売上拡大施策は、次の三つになる。

  • 対象データの拡大
  • 分析者の増加
  • 協業パートナー企業の売上奪取

で、ITベンダが年に一回~二回で開催する年次イベントでは、従来の外部連携用External Tablesに加えて、Hybrid Tables(S3互換ストレージ用)とIceberg Tablesが追加されることになった。従来のExternal Tablesに関しても、Dell ECSとPure Storage FlashBladeが主要パブクラ三社のオブジェクトストレージに追加されることになった。

もともとSnowflakeデータレイクは、各社のオブジェクトストレージ上で動作している。それに分析作業に利用するデータを保管する訳だから、業務用DBなどのデータを移動させるような真似はしない。あくまでSnowflakeデータレイク内にコピー&データ変換(ELT処理)するだけだ。

だからSnowflakeがデータの流通ビジネスをするつもりはないだろうと見ていたら、どうやらその通りに動いて来たと言える。新テーブルを開発したから利用料を頂くという考え方はあるけれども、それは有料データへの紹介料を取るビジネスモデルではない。Snowflakeとしては現在の顧客を深耕し、顧客当たりの売上を高めようとは考えていない。

なお分析者の増加に関しては、Python正式サポートを実現したり、マーケットプレイス開設を発表し、すでに存在するSQL開発者エコシステムに続き、開発者コミュニティを呼び込み&育成することを発表した。これもマーケットプレイス運営費分程度は回収するだろうけれども、ともかく利用者を増加しようとしている。

つまりSnowflakeとしては投資家からの要望に対応するための新施策という形で打ち出してはいるものの、目先の売上拡大よりも、長期的なデータ分析クラウド市場の創設&独占的立場の確保を狙っていると言える。データ分析に特化した “第二のAWS” を目指していると表現することもできる。

このあたりの評価/分析は、SiliconAngle誌が年次イベントに記者派遣や、CEOを含む幹部インタビューを実施しているので、興味のある人は一読することをオススメしたい。

なお一見するとDell(旧EMC部隊)やPure Storageといったストレージ企業と連携したり、Apache Iceberg活用とパートナー連携強化に見えるけれども、実態は逆だったりする。

中国の兵法書 “兵法三十六計” にある遠交近攻である。今回の新Tablesを活用すれば、IBM CloudPakやInformaticaのようなDIツールは必要ないし、結局はOracleみたいにユーザがユティリティプログラムを書く場合には、TableauのようなETLツールも必要ない。ITシステムという視点で見れば、既存ストレージや開発者が頑張って、これらのツール費用を節約できるという構図になる。これらをユーザとSnowflakeで分かち合うことになる。

もちろんユーザへの負担は増えるけれども、今は変化の激しい経営環境に柔軟に対応するため、アジャイルな開発や運用が必要とされる時代だ。特にDIツールは複雑だからSIが必要になるが、これが軽減できるのは嬉しいことだ。

なおSnowflakeとしては2022年11月に、初めて開発者向け年次イベントを開催する予定とのことだ。

しめくくり

以上の通りで、「今のところはデータ分析者が標準的に利用するクラウドになる可能性がある」というか、SiliconAngle誌もデータ分析用途でのデファクト(“事実上の標準”という意味)を目指していると評価している。

さらにCEOインタビューによると、冒頭のSlideshare資料でもタイトル部分で協調されているように、Snowflakeはトランザクション的な処理にも対応できる設計となっている。つまりOracleなどのRDBによるトランザクション処理を採用した業務システムのように、Tableaなどで整理/表示するだけでなく、がっつりとデータ処理プログラムを書くことにも使える。そこまで普及したら、もはやメインフレームやオープンシステムに続く、新たなITシステムの登場にもなりかねない。

なおSnowflakeが目指した通りに成功する保証は、今のところ不明である。狙いは大変に良いし、ベテラン経営陣によるチームではあるけれども、ハイリスク/ハイリターン戦略であることに変わりはない。

IBMやHPEといった長年の伝統と数十B$のような売上を持つ企業の株主は、資産を大幅に増やすよりも激減させることを嫌がる(積極投資ではなくて、資産を失わないための運用)だから、ローリスク/ローリターン戦略を好む。

かつてIBMは「巨象も踊る」と一時的に組織改革に成功したけれども、長くは続かなった。GE(ジェネラル・エレクトリック)に至っては、2000年時点のトップ企業が、残念ながら今は見る影もない。

だから僕ごときが、Snowflakeが成功する/失敗すると、これから新戦略に挑戦する時点で予測することは出来ない。それにSnowflakeの面々は「何が何でも成功させよう!」と、運命を自分たちで変えようとしているのである。現代科学では、さすがにそういった要因まで含めて分析する数学的技法も確立されていない。

言えるのは、Snowflakeとは縁もゆかりもないけれども、ぜひ成功目指して頑張って欲しいというくらいだ。成功したら、ITテクノロジーは一段と進歩するだろう。それは大変に嬉しいことになると思う。

それでは今回は、この辺で。ではまた。

————————-
記事作成:小野谷静