技術基盤チームの黒曜(@kokuyouwind)です。
2024年8月3日から4日にかけて開催された SRE NEXT 2024 に参加してきました!
社内での情報シェアで満足してブログを書くのをすっかり忘れていました。そうこうしているうちに来年開催分の告知記事が出ちゃいましたね…
大遅刻となってしまいましたが、ブログを書くまでがカンファレンスなので参加レポートをまとめておきたいと思います!
印象に残ったセッション
SRE NEXT の参加は今回が初めてだったんですが、監視やセキュリティなどの技術的なセッション・工学的見地でのアカデミックなセッション・組織作りや運用など実務事例のセッションなど話題が多岐に渡り、それに加えてパネルディスカッションも多く開催されていてバラエティの豊かさに驚きました!
先日のインタビュー記事で触れたとおり弊社技術基盤チームの組織構成を模索中なので、今回はそこに活かしていけそうな「SRE組織の立ち上げ方」「SRE文化の実践方法」などのセッションを中心に聴講させていただきました。そのなかでも個人的に印象に残ったセッションをいくつか紹介したいと思います。
Enabling SRE by Guide Maps
日本産経新聞社の清水さんの発表です。
こちらは SRE チームが Platform SRE と Enabling SRE の両軸でどのように他チームに働きかけているか、具体的なプラクティスをいろいろと紹介されていました。
なかでも SRE Trail Map は非常にわかりやすいですね。
おそらく CloudNative Trail Map を元にしているんだと思いますが、検索してもこの発表以外出てこないのでオリジナルだと思われます。
さらに、それぞれの項目について概要・社内での実践例・ステップが実践できているかのチェックリストなどが Notion でわかりやすく整理されているのも素晴らしい。活用しやすそうで、ぜひ真似したいポイントです。
この SRE Trail Map の概念と各項目をまとめた Notion はぜひとも参考にしたいんですが、社外公開されていなさそうなのが残念です…
事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換
ビットキーの@0x11FEさんの発表です。
チームトポロジーを元に SRE の活動を分類したうえで、事業や組織の拡大に伴う組織変遷のなかで SRE がどういう取り組みをしてきたかの事例紹介をするセッションでした。
弊社もチームトポロジーの用語を使って組織構造の議論をすることが多いのと、技術基盤チームで SRE の取り組みをどうやっていくか探っていることもあって、分類の仕方や具体的な事例など参考になる部分が多かったです。
ところで Platform SRE や Enabling SRE などの用語は他の発表でも見かけることが多かったんですが、結構定番の分類なんでしょうか…? 検索してみたんですが具体的な出典などはよくわかりませんでした。
徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例
mixiの@bbq_all_starsさんの発表です。
多くの Web サイトをホストする CMS ウェブサイト基盤を少人数で運用するために、高度な自動化を行って手動作業を責任判断が伴う箇所のみに絞っているよ、という事例紹介セッションでした。
トイルの自動化は基本ではあるんですが、 Terraform モジュールを整備したうえで実際のリソースを作るところも典型的な構成をジェネレーターで吐き出す、というところまでやってるのは初めて見たので感心しました。
Terraform で CloudFront や EC2 などの実システムだけでなく、 PagerDuty などの監視や Chatbot + Lambda の内製ツールまで一緒にできあがるのが徹底していますね…
実際ここまで Terraform だけでできると効率化だけでなく設定漏れや間違いなどの事故も防げて、安全性やガバナンス観点でも理想的だなと思いました。
宇宙科学研究所の探査機運用システムにおけるSREのプラクティスの導入と月着陸実証機SLIMでの利用
宇宙科学研究所の中平さんの発表です。
こちらはスライドが公開されていなさそうなので、内容が近い別イベントでのスライドを貼っておきます。
月着陸機の監視システムに Grafana などのオープンソースツールを使って実際に運用した事例紹介セッションでした。
どちらかというと組み込みシステム寄りの話なので弊社業務とはあまり関係ないんですが、ただただ Grafana ダッシュボードがかっこよすぎて印象に残りました。
こんなん全人類大好きなやつでしょ(クソデカ主語)
個人的な好みは置いておくにしても、リアルタイムな情報をもとに画像を表示したり着陸軌道を表示したりなど、かなり高度な可視化が Grafana で出来るんだというのを全く知らなかったので驚きました。 ElasticSearch のログくらいしかグラフにしてなくてごめんよ…
また、チーム外からのプロジェクトへの風当たりが強かったがとにかく良いものを作って実績を作って黙らせた(意訳)みたいな話がパワーを感じて良かったです。
導入について。当初は個人応募的な開発予算で小規模に施策して、たまたまSLIMプロジェクトとのニーズと合致して本格化した。実際に使う人からの評判はよく当初想定異常に利用が広がった。一方で内製開発への批判など少し離れたところからの風当たりを強く感じた #srenext
— 黒曜@Leaner Technologies (@kokuyouwind) 2024年8月4日
すべてに説明を尽くすことは諦めて、実際に利用するプロジェクトとの信頼関係を重視してとにかく一緒に良いものを作ることに集中した。最終的に月着陸の中継での利用を見せて納得してもらえた #srenext
— 黒曜@Leaner Technologies (@kokuyouwind) 2024年8月4日
その他の印象に残った出来事
ジョブボード
大きなジョブボードが用意されていて、いろんな企業さんが求人情報を書いていました。賑やかでいいですね!
ちなみに、大きく書かれたペンギンのキャラクターはけろぺんというらしいです。けろぺんかわいいよけろぺん。
今年から SRE NEXT の公式キャラクターになったらしく、まだイラストが 2 種類しかないそうです。来年以降の新規実装に期待したいですね。
公式懇親会
初日夜に行われた公式の懇親会は、なんか地下のクラブですごいパリピ空間でした。(語彙力)
懇親会会場、めっちゃクラブだった。そしてオリジナルのCOLD IPAが配布されててすごい(佐渡ヶ島で仕込んできたらしい) #srenext pic.twitter.com/8ei179NMV4
— 黒曜@Leaner Technologies (@kokuyouwind) 2024年8月3日
Party Sponsor の Cloudbase さんは、この日のために佐渡ヶ島に渡ってビールを仕込んできたらしいです。なんて???
最後に
SRE NEXT 2024、初めての参加でしたが色々参考になる発表を聞くことができ、なにより楽しませていただきました。
登壇者の皆さん、スタッフの皆さん、本当にありがとうございました!!!
スタッフの皆さんありがとうございました!!! #srenext #srenext_a pic.twitter.com/q2HoUCpSKO
— 黒曜@Leaner Technologies (@kokuyouwind) 2024年8月4日
次は来年の7月、東京・有明での開催ですね!
我々もスポンサーとして協力したり CfP 出せると良いなと画策してますので、また来年もよろしくおねがいします!
宣伝
弊社、 SRE めっちゃ募集してます! ちょっとでも興味ある方はぜひ Pitta でカジュアルにお話しましょう!!!
また SRE も含めた技術基盤チーム全体についてのインタビュー記事もあります。こちらも見ていただけると嬉しいです!!!