2019/08/28

Weworkに移って半年の感想(コミュニティ編)

続きまして、Weworkに移って半年の感想、コミュニティ編です。

前回は、オフィススペースとしてみたときのwework(というよりシェアオフィス)のよさ、というか、weworkってなんでこんなに高いねんっていう疑問への私なりの回答(もしくは援護)を並べてみたのですが、それにしてもちょっと高い(笑)。周りのキレイなシェアオフィスと比べても2割増しほどの割高感があって、じゃあ自分はその価値をどう考えたか、なぜ2割増しでもweworkの方を選んだのか、その選択は半年経ってみてどうだったのか、という話です。

【コミュニティ機能】

やはり、特筆すべき点として挙げられるのは、売り文句の一つにもなっているであろう、コミュニティ機能です。他のシェアオフィスと比較しながら移転先を考えていたときも、これはwework独自の価値観でした。

ウチの仕事は、データ分析と、それに関連するコンサルティングなのですが、データ分析というのは地味にオフィスでデータをいじくり回していることが多い仕事です。俗に、データ分析は前処理8割と言いますが、それは本当で、一週間オフィスに籠もりっきりで前処理してた(実際には、前処理用のプログラムを書いていた)ということが普通にあります。また、仕事のスパンも長いので、ひとりが一年に担当できる業務はせいぜい数本です。一方で、一人前のデータサイエンティストになるには、お客さんにどれだけ有効かつ現実的な提案ができるか、コンサルティング力、コミュニケーション力が求められます。それは、毎日毎日同じ顔ぶれの環境では培われないな、と。様々な背景、目的、考え方、立場の人達とのコミュニケーション経験を通じて醸成されるもので、ひとりの職人の元で他の誰とも交流せずに身につくものではないです。

昨年までは親会社と同じオフィスにいたので、ある程度偏りはありつつも、自分達とは異なるベクトルをもつ集団と隣で仕事ができたことは、ウチのメンバーにとってのよい成長の芽になっていたと思いますし、その逆、自分達のベクトルが、相手への新しい視点だったり、新しい価値観だったり、なんらか影響を与えることができた部分もあったかな、と。じゃあ、それをもっと多様な「隣人」を持つことで、もっと面白く、もっと多様性のある環境にできたらいいんじゃない?

weworkはそれがコンセプトとして掲示されています。もちろん、他のシェアオフィスでも、もしくは貸しオフィスでひとりでやっていたとしても、自分達が積極的にコミュニケーションを働きかけていけば何とでもなるのですが(実際、自分自身は創業時からひとりの環境でそれをやってきたので)、そういう環境を、僅か二割増しの家賃で手元にぐっと引きつけられるのならば、それはめちゃめちゃ価値あることなんじゃないか。

イメージは、20年前に読んだ「iモード事件(松永真理著)」です。ドコモさんのiモード開発話の裏には、松永氏が仕込んだ「クラブ真理」というコミュニティがあって、そこでの、非公式で、ゆるい関係性から様々なアイデアが生まれましたが、weworkを知ったときに真っ先にこれを思い出しました。weworkはクラブ真理なんですね。(ってことを最近四谷のマネージャーさんとお話したら、「クラブヨシエを作る!」と仰っていました(笑))。また、以前勤めていた会社でも、重要な意思決定はすべてタバコ部屋で決まるというネタもあったり。これはつまり、ビジネスにしても何にしても、新しい視点、新たな発見、創発、そういったものは、弱い紐帯、weak tie からやってくるというグラノベッターです。一時期、複雑系とか社会ネットワークなどを研究していたことがあって、これは全く腑に落ちます。クラブ真理やタバコ部屋は、この「弱い紐帯」を繋げる機能を無意識的に創り出したものなのですが、weworkはこれを意識的に繋げようとしています。

ところで、実は長年、社会ネットワークや創発の周辺で仕事をしてきて感じていることなのですが、もしかして創発は稀にしか起こらないから創発なのであって、意図的に起こそうとしても無理なんじゃないか、創発の可能性を上げようという試みは無駄なんじゃないか、創発は起こるべくして起こるもので、起こらないところにいくらエネルギーを投下しても確率はほとんど変化しないんじゃないか、というモヤモヤがあります。だから、このweworkの試みというのは、社会ネットワーク的に非常に興味深い実験でもあるわけです。創発を意図的に起こせるのか、それは、もともとそのポテンシャルのある点だったから起こっただけで、意図的に起こそうとするアクティビティにどれだけの意味があるのか。その答えは、今後 wework から生まれる「創発」を観察していくことで、少しずつ見えていくんじゃないかなと思います。


【いい意味でのユルさ】

weworkは、ユルいです(笑)。いろんな意味で。一応、いい意味で。

何がユルいのかはいろいろ波紋を呼ぶと思いますので書きませんが、シェアオフィスを回ってみるとそのユルさが際立っています。ジャパン的な、手取り足取りやってくれるきめ細かで具体的なサービスは期待しちゃダメ。「こっちは客だぞ!高いサービス料払ってんだぞ!」と怒っちゃう人はweworkに向いてない。このユルさを楽しみ、ある意味、乗りこなすくらいに思っていた方がいい。そう思えたときに、実は真の価値が見えてきます。

このユルさは、逆に言えば自分達入居者の意識の方向性が問われるんですよね。自由気ままに、周りの迷惑を気にせずむしり取ろうと思えばいくらでもそうできちゃうけれど、自分達がそこにちゃんと意味を考えて、コミュニティの価値を保つためにどう振る舞うべきかを考え、行動しなければ、この仕組みはすぐに崩壊して、ただの割高なシェアオフィスになってしまう。コモンズの共有に慣れていないと辛い。人が誰しも持っているフリーライダー的萌芽、また、フリーライダーを憎み、かつ羨む心は人間誰しもが持っているものですが、それを「社会」として乗り越えたところに、この仕組みの本当の価値が見えてくるし、その意味で参加者になれるんじゃないかなと。上で挙げた、「弱い紐帯」という社会ネットワークの真の価値は、たぶんそこにあります。

ユルいコモンズの価値を最大限に高める原理は、「Give And Give」です。参加する全員が、その多少はありつつも、自分ができる範囲で、無理せず、Giveすること。もちろん、その気が無い人はGiveしなくてもいいけれど、それを糾弾しないこと。そして、Take を期待しないこと。コミュニティからむしり取ることを意識しないこと。そうすることで共有地の価値が上がっていき、結果的には大きな価値となって降ってきます。(これはゲーム理論の基本(笑))その意識を持てる人がどれだけ増えていくか、フリーライダーは必ず発生しますが、それを超える貢献者が育つかどうか(例えば、貢献が必ずしも貢献者には返らず、フリーライダーに落ちたりすることを許容できるか)、貢献者からフリーライダーへの転落をどれだけおさえられるかで、コモンズの盛衰がきまります。非常に面白い実験だと思います。


【半年経って】

少なくともウチの(若手の)メンバーは、もし占有オフィスだったら得られなかった外の世界との、プライベート以上仕事未満の繋がりを増やしているように思えるので、この移転はウチにとっては大成功だったと思います。

たぶん、この「プライベート以上仕事未満」というのが、弱い紐帯のポイントかなと。グラノベッターが挙げたような、ちょっと遠い親戚っていうのに近い。がっつり仕事を一緒にやるのではなく、かといって、全くプライベートでの付き合いでもないところ。たぶん、仕事の斜め上くらいで繋がっている学会とか、ある技術の勉強会とか、そういうのに似ている。プライベートではなかなか仕事に繋がるような話題には出会えない、出会いにくいし、かといってべったり仕事関係になってしまうと、アイデアとか気づきとか言う前に成果を出さなければならなくなる。だから、こういう中途半端な関係性、「ユルい」関係性にこそ、「気づき」があるし、それがこの場所の価値なんじゃないかな。

また、これもコミュニティ×ユルさの現れの一つだろうと思うのですけれど、気軽にイベントを開催できるのもすばらしい魅力です。学会発表まで行かなくても、仕事に関連してちょっと興味があって調べたこととか、研究したことなど、もしくは、勉強会程度の発表など、これもプライベート以上仕事未満の話題について共有したり、議論したりできる場という意味で、手頃な大きさのイベントを開催できるのは非常に面白いです。そしてその内容の縛りについても、「コミュニティに資するもの」という非常に漠然とした縛りしかないので、なんか面白そうとか、なんか役立ちそうというふわっとしたレベルで開催できる。これは、学術で言うところの「サロン」ですよね。学術では、研究者が一カ所に集まって様々な議論をしたり、自分の研究を披露して意見をもらったりしながら発展してきた歴史がありますが、その場所があります。クラブ真理の重要な機能の一つだと思います。ウチのメンバーも何度も参加したり、主催したりしながら、この「仕事未満」を積極的に楽しめていると思います。



ということで、二本に渡ってwework半年記念の感想を書いて参りました。これらのことは、ウチとは異なる業種だったり、異なる規模感だったり、異なる目的だったりする方々には当てはまらないところも多いだろうと思いますが、中にはこう思って参加している会社もあるんですねっていうサンプルの一つとして、もしくは、これから入居を検討している誰かに、ちょっとでも役に立つことがあればと思います。

あと、コミュニティの仲間内の皆さんには、私達はこういう気持ちでここにいますので、何か困ったことがあったり、気になること、聞いてみたいこととかあれば、おそらく意味のある回答ができるのはデータ分析に関することが中心になるとは思いますが(他には?・・・統計・数学とか、中学受験とか、男性の育休などの話題もアリかも)、ラウンジでつかまえてくださっても構いませんし、内輪のSNSなどで適当にお声がけ頂ければと思います。特に、データ分析での悩み事って、その多くは茶飲み話程度で解決したりするものなので。 おそらくこれが、私らのコミュニティに対する Give And Give できるものだろうなと思っています。

2019/08/27

Weworkに移って半年の感想(ワークスペース編)

昨年の3月にオフィスをWework四谷に移しまして、それから半年経ったので感想を書きます。

なにかと話題のシェアオフィスなので、良いも悪いも様々な話題がネット上で飛び交っているような気がします。今回、これを書こうと思い立ったのも、wework japanの公式twitterアカウントが批判(というより誹謗中傷に近い)ツイートをRTしていて、これは援護射撃してくれってコトなのかな?と思ったからなのですが、中にいないと分からないこともあるし、中にいたとしても立場や状況によって見方がかなり変わるので、一つの利用者ケースとして書いてみようと思います。

さて、ウチが入居したのは四ツ谷駅目の前にあるWework東急四谷。ビルの3Fから9Fがweworkで、フルで1500人規模だそうなので、かなり大きめの拠点だそうです。新規開店だったので移転の意思決定したときはまだ内見などができず、別の拠点を見て決めざるを得ませんでした。その時に案内されたのが日比谷のweworkで、内階段をかなり推されたのが印象に残っていたのですが、なんと四谷には内階段がない!

という最初の躓きはあったものの、2月末に入居手続き、その時はまだ内装工事中でしたが、2019年の3月頭に入居となりました。まずはこの入居フェーズ。参考までに、今回移転した人数は8人、確保した居室は9人部屋です。

入居にあたっての契約は、不動産賃貸契約ではなく、あくまでもサービス契約です。よって、普通にオフィス賃貸を借りるとついてくる敷金、礼金などはありません。また、何ヶ月分を前金でというのもありません。但し、保証金のようなものは二ヶ月分だけ預けます。もしウチがバックレたときは召し上げられますが、円満に退去すれば戻ってくるはずですので、つまり、使った月数だけの支払になります。

また、内装工事は不要、というか、不可です。その前に、契約形態がありますね。いくつか種類があって、普通にオフィスとして使うのならば、占有スペースのあるプランになります。(その他は公式情報等を参考に。)占有スペースでは基本的にはあるものをそのまま使います。机と小物入れと椅子が標準装備されていて、それ以外のものは持ち込みますが、占有スペースは小さいのであまり沢山のものは持ち込めません。 ウチは仕事柄、書籍を沢山持っていたのですが、いまは段ボール箱で20箱ほどをトランクルームに預けています。書類なども置いておくのは凄くコスパが悪いので、重要書類はともかく、そうでないものはスキャンして廃棄するか、トランクルーム行きです。つまり、weworkに移転すると強制的に断捨離できます(笑)。(自分のノートPCだけもって移転してくるのが理想ですが、会社の本部を移すには書類で持っておかなくてはならない面倒なものがいくつかあるので、最低限それだけは持ってきました。将来は全部クラウド化して、本当にノートPC一枚で移転できたらいいですね。)

このように、一般に、ある程度年数の経った企業のオフィス移転では敷金、礼金、内装、引っ越しの費用を全部合わせると数百万円~千万弱かかるものですが、これがほとんど不要です。さらには、賃貸契約では退去時の原状復帰にも数百万円かかりますが、これも不要。weworkは高いとよく言われていて、確かに月額利用料だけ見ると高いのですが、この初期費用、退去費用が無くなる分は考慮すべきポイントだと思います。さらには、内装をするには設計から施工までの面倒をみなきゃならなかったり、普通の移転には意思決定者には様々な雑用が舞い込んできますが、wework(というよりシェアオフィス)にすることで、そういった様々な雑用から解放されますから、そういうのが好きな人ならいいですけど、私はどちらかというとそういう用事は誰かに任せて自分の仕事をしたい方なので、weworkはめちゃめちゃ楽でした。

さらに費用面。トイレやパントリー、受付、ラウンジ、会議室、プリンタは共有です。水道光熱費は月額サービス料に込み、プリントと会議室はチケット制で、一定量のチケットもサービス料に含まれています。また、トイレやパントリーを含む共有スペースの掃除、ゴミ捨て、ビルメンテナンス関連、コーヒーやお茶、氷、ミルクの用意と片付け、これらがすべて付属しています。よく、weoworkといえばタダでビールが飲めるというところばかり喧伝されていますが、最も多く消費されるのはおそらくコーヒーだと思います。(なお、私自身はアルコールNG。)オフィス専用のマグカップが毎日大量に使用され、洗ってもらっていますが、これらの費用もサービス料に入っています。よって、これまで基本的にはほぼ月額のサービス費のみです。たまに追加の会議室利用料がかかるくらい。

さて、これを高いとみるか、安いとみるか。ウチは7人+外部協力2名の9人で月額100万円程度になっていますが、引っ越し前は渋谷のそれなりに駅近にいたので、坪単価がおよそ3万円、スペースをかけて、60万円~70万円程度が家賃+オフィス維持費のみにかかっており、これに様々な諸経費を入れると、90万円くらいにはなっていましたので、実はそんなに大きく変わっていません。


但し、これは会社の事業内容やフェーズにも寄ると思います。できたてほやほやのネット系スタートアップで、まだ収益化の道が見えていないフェーズならば、こんなに高額をオフィスに費やすのはリスクが高すぎる。マンションの一室で始めれば月額10万円~20万円程度でもいける。ウチも最初はそうでしたし、固定費はできる限り削った方がいいし、創業メンバーが手間暇掛ければできることならばそれは自分でやった方がいい。ただ、年数が経ってくるとそれではだんだんやっていけなくなる最初のポイントは、従業員の増加です。創業メンバーなら、株も持っているし、自分が我慢した分だけ会社の内部留保が増えていくので、劣悪な環境でもいくらでも我慢できますが、被用者はそうではないです。また、事業が軌道に乗ってくればお客さんとの会議も増えますが、お客さんに靴を脱いで上がってもらったり(和風内装除く)、ユニットバスのトイレを使ってもらったりするのは、駆け出しのベンチャーならまだしも、ある程度稼いでいる、年季の入った会社では敬遠されそうです。

ちなみに、個人的にはオフィスグレード Point Of No Return はトイレだと思っています。自分も、従業員も、一度グレードアップすると、二度とその前のトイレには戻れません。ポイントは、トイレがオフィススペースから離れていて、男女が別れていること。次に、清潔さ、明るさと、ウォシュレット。これ、かなり重要です。少人数のオフィススペース探しはこれが意外に難しくて、フロア貸しだとトイレが男女共用だったり、別れていてもオフィススペースとの間の仕切りをある程度しっかり取る必要があったり(その分、ワークスペースが減る)。あとは選択肢として、共同トイレの雑居ビルか、それともweworkのようなシェアオフィスになってきます。ウチの移転ではトイレを最優先課題と考えていましたが、結局トイレのグレードはそのまま坪単価や人単価に跳ね返ってきます。(逆に、古い物件でもトイレをめっちゃキレイにしたら坪単価を上げられると思うんだけれどどうだろう?)

あと、ウチとは違いますが、他の入居者の皆さんを見ていて思うのは、短期間でチームを作ってワークスペースを確保し、成果を出したらリリースするという仕事の形式に合うなと思いました。例えば、自社ビルの建て替えの間だけとか、あるシステムの開発の間だけとか。weworkは決してベンチャー企業だけのものではなくて、むしろこういう利用の方が多いんじゃないかってくらい、中規模~大規模の企業のテンポラリワークスペースとして活用されているように思います。例えば、開発プロジェクトなどでエンジニアをひとり調達すると100万円~200万円/月になりますが、そのうちざっくり10万円がワークスペース費用になると思えば、実は大した経費ではないです。これって、クラウドと同じですね。データセンターに自前のサーバーをたてるか、使いたいときに使いたいだけのマシンパワーを用意するか。前者はその分のリスクを自分で持つし、後者は単価は高いけれど低リスクで運用も保守も全部やってくれる。使いたいときと言うのは、収益が上がるときだから、それに直接付随するコストはほぼノーリスクです。こういうサービスは、導入費用、事後費用、保守費用の他に、リスクをちゃんと計算に入れないと見合わないようになっていて、但し、全部入れ込むとどちらもそんなに変わらない結果になります。私は自分の住居は買わずにずっと賃貸暮らしなのですが、不動産を買うというリスクを引き受ける気が無いので、いくら買った方が安いと言われてもその気になりません。買ってしまったせいで失う選択肢の価値の方が大きい。それと同じで、自社ビルか、賃貸契約か、オフィスサービス契約か、この順で単価は高くなるのですが、それは引き受けているリスクと反比例しているんですよね。このリスクをちゃんと算入しないと、よく言われるように「高すぎる」という評価になると思います。まぁ、それでも高いですけど。

他には、外国籍っぽい企業さんも多いです。ラウンジでは常に日本語ではない言葉が飛び交っていますが、もしかしたらこれは日本の「賃貸契約」の仕組みが合わないのかな、と思ってみたり。圧倒的にweworkの方が契約が楽ですし、契約書類も英語と日本語が最初から用意されていて、連帯保証人などというわけわからんものも要求されませんから、日本的賃貸に慣れていない人にとっては、wework(もしくはシェアオフィス)は数少ない選択肢なのかも。

あ、もう一つ、公的機関の出先っぽいところがいくつかあるのも特徴かもしれません。これは単年度予算の関係でしょうか?使う間だけの契約をすれば良いのは、単年度予算に合いますね。
 
さて、ここまでの話は、実はweworkでなくとも、他のシェアオフィスでも同じように当てはまるところだと思います。weworkは高いけれど、ワークスペースの価値としてみたらそうでもないです。ただ、安くもないので、収益化の目処が立っていないベンチャーにはリスクが高いと思います。小規模事業者なら、ある程度売上が立っていて、営業に出やすい駅近希望で、よくお客さんが来訪して、トイレに気を遣うレベルの従業員ホスピタリティを求められるようになってきていたら、選択肢の一つだと思います。

でも、実は他のシェアオフィスはもうちょっと安い。某おしゃれなシェアオフィスと比べても2割増しくらいのイメージ。その差額はコミュニティ機能にありそうですが、長くなってきたのでまた今度。

新しくなった Google AIプラットホームはクラウド分析環境の決定版か?(実施編)




先の記事「新しくなった Google AIプラットホームはクラウド分析環境の決定版か?(前置き編)」に引き続き、具体的にR×BigQueryの環境をGCPに立ち上げてみます。また、その使い勝手について感想を書きます。

まずはGCPのコンソール画面から、「AIプラットホーム」「AI Hub」を選びます。AIプラットホームは人工知能のカテゴリにあります。

 AI Hubはカタログなので、この中から好みの分析環境を選べばよいのですが、今回は私の好きなRの環境を選びます。AI Hubにはたくさんの環境があるので、ここから探し出すのは結構大変なのですが、まずは AI Hub のトップページから Scope の Public を選ぶと探す画面になるので、一番下の Labels の中から R を探してセットします。

 すると、「Exploratory Data Analysis with R and BigQuery By Google」というそのまんまなエントリが出てくるので、これを選んで、[Open in GCP]しましょう。

「AI Hub からノートブックを開く」のページで、インスタンス名(任意)やインスタンスの地域、ゾーンの設定をして、フレームワークで「R 3.5.3」(現状)を選び、マシンタイプやブートディスクを設定してから[作成]します。地域はまだTokyoは選べないみたいです。

1分程度で「Jupyter Lab」が立ち上がります。すると、「Exploratory Data Analysis with R and BigQuery」というサンプルが立ち上がるので(というより、このサンプルを立ち上げるためのパッケージらしい)、この真似をすればRとBigQueryが使えます。

例えば、隣のタブに「Launcher」があり(もしくは左上の「+」を押す)、その中にR Notebookがあるので、それをクリックすると新しいnotebookが立ち上がります。Rなので、例えばこんな感じ。


BigQueryと繋ぐには、先ほどのサンプル(最初のタブ)の「0.Setup」にある、


を実行すれば、OKです。最初の、installには数分程度かかります。しばらく返ってこなくて不安になるのですが、左上の「+」からConsoleを立ち上げて top などで見てみると、cc1plus がずっと動いているので、インストールに頑張っている様子が見られました。



その後、BigQueryからRへデータを持ってくるには、

data <- bq_table_download(
    bq_project_query("my-project", query="SELECT x,y,z FROM `
my-project.test_aihub.reg_sample`")
)

などでOK。なお、my-project がこのインスタンスを立ち上げているGCPのプロジェクト名(ダミー)で、test_aihub が事前に仕込んだBigQueryのデータセット名、reg_sampleがテーブル名、x,y,zがテーブルのカラム三つです。BigQueryではこんな感じ。



引っ張ってきたデータを観察すると、



このように BigQueryからRへクエリ結果をダウンロードできました。Rらしく例えば回帰分析をしてみると、



あとは普段の R notebookです。個人的には、Intellisenseッぽい動きをしてくれるR Studioの方が使いやすいのですが、Jupyterも慣れていけば使いやすくなるはず。

さて、このAI Hubから立ち上げた分析環境、これをJupyterLabと呼ぶようですが、この画面はセーブ(notebook左上のフロッピーのマーク「Save The notebook contents and create checkpoint」を押す)しておけば変数も含めて保存されています。つまり、JupyterLabでセーブして、ブラウザを切断しても、計算過程は残り続けます。





そして、例えば外出する前にセーブし、ブラウザとPCを閉じて、オフィスに戻って再度JupyterLabに接続すると、先ほどの作業過程がそのまま残っています。これは実は地味に大切な機能で、分析の途中で他のことをしなければならなくなる、その時に、今の散らかした状態をそのままにしておけるというのは、ローカルマシンでは当たり前にできることなのですが、クラウド環境ではこれまであまり重要視されていませんで、例えばJupyterLabの前身のdataLabでも、教育用collaboratoryでも、セッションが切れたり、時間が経過したりすると、計算の途中経過ごとカーネルが脱落していて、せっかくの計算をまた最初からやり直すことになってしまいます。計算が一瞬でおわるものならそれでもまだ我慢できるのですが(notebook自体はセーブできたので)、一回の計算に数時間がかかるようなものでは、カーネルの脱落はため息しか出ませんので、この、checkpointごとセーブする機能はすごくありがたいです。

ちなみに、一旦ブラウザを落としてから、再度notebookに接続するには、GCP Console から AIプラットホーム → ノートブックでノートブックインスタンスの一覧画面になるので、そこから[JUPYTERLABを開く]で開きます。いままで[SSH]ボタンでSSHを開いていたのと同じ感覚で、JupyterLabを開くことができます。超便利です。

さらに、ここまでできるのならばやはり期待するのは、「数時間かかる計算を投げた後、ブラウザを落としてセッションを切り、次の日に回収したい」ですよね。データ分析では計算に数時間かかるのはよくあることで、その間に他の仕事をしたり、夕方に計算を投げて明日朝回収したり、複数の計算を同時に投げて順番に回収したりというのはよくあることなのですが、ローカルマシンだとずっと立ち上げっぱなしで熱くなってしまうし、なにより電車移動などができなくなってしまうし、かといってクラウドではセッションが切れると計算が落ちてしまうし・・・。昔、consoleで計算をしていた時代は、nohupをつけてバックグラウンドで計算させたり、screenを使ったりしましたが、JupyterLabはその分析環境版たりえるのか。

そもそも、AI Labの中には機械学習など、処理に大量の時間がかかるものが多いので、そういう環境でない方がおかしい。そこで、ちょっと時間のかかる砂漠の壺埋め的なコードを書いて実行し、そのあと「Save Checkpoint」した後にブラウザを切って、また繋いでみたところ・・・





このような微妙な結果に。上のfor文で素数を300000まで数え上げて、その個数をlengthで表示する計算ですが、このセルを実行して、すぐSave Checkpoint、ブラウザ切断、しばらく経って(終わった頃に)再接続してみたところ、[]の中に数字がなく、計算が終わった形跡がありません。また、length(a)の結果も出ていません。しかし、そのあと[14]でtail(a)を見てみたところ、ちゃんと299993まで計算が終わっています。これはよく読めばどこかに説明があるのだろうとは思いますが、計算は完了するが(実際、ブラウザを落とした後にSSHでインスタンスに接続してプロセスを見ると、Rは動いています) notebookへの出力はされなかった、と言うことなのかなと。これ、もし知っている人がいらっしゃったらぜひ教えて下さい。

最後にもうひとつだけ。このJupyterLabで作成したnotebookは、実は当該プロジェクトの参加者全員が閲覧、編集できます。(どこまでプロジェクトの権限に依存するんじゃないかと思いますが、未検証。)と言うことは、誰かが作ったnotebookを、別の人が確認、計算したり、書き加えたり、修正したりできます。GCPのプロジェクトの参加者に加えれば共同編集ができるということになります(但し、リアルタイムには反映されず、セーブを通じての共有になります)。同じnoteを共有することになるので、誰がいつどんな編集をしたかが分からなくなったりする可能性も多少は気になりますが、それよりも、notebookをそのまま共有できるのはありがたい。これはつまり、分析の指示者と実施者が同じnotebookを見ながら議論ができるということです。

将来的には、例えばデータ分析の発注者が自社のGCPプロジェクトのBigQueryにデータを用意し、そのプロジェクトにデータサイエンティストを招待して、JupyterLabで分析をしてもらってnotebookに結果を残してもらう。そして分析が終了したら、このプロジェクトから分析者を外せば、分析プロジェクトのプロセスと結果が残り、セキュリティが保たれ、分析者も後のデータの処理に困ることが無い、という理想的なプロジェクトの終わり方ができます。(そしてまた、もし分析者に再度入ってもらうには、もう一度プロジェクトに招待すれば、以前のデータと環境がそのまま残っているわけです。)あるべきところにのみデータがあるのがよいセキュリティに繋がりますから、これは将来の理想的な分析環境です。実際には、まだデータをローカルにダウンロードする方法がいくらでもあるので、まだ完全とは言えませんが、意図的にダウンロードしない限りローカルにデータが無いというのはかなり嬉しいことです。

ということで、二回に分けて、Google AIプラットホーム、JupyterLabで実現されたクラウドデータ分析環境について書いてみました。もちろん、まだまだローカルマシンの方がかゆいところに手が届くのですが、その差が俄然縮まってきましたので、ターニングポイントはもう目の前だと思います。