SRE (Site Reliability Engineer) 職(中途)
開発速度と信頼性はトレードオフであり、バランスを取っていく必要があります。SRE の役割は、サービス特性、開発フェーズ、利用ユーザーの体験などを考慮しつつ、Product Owner とともに SLO を定義し、ソフトウェアエンジニアリングとシステムエンジニアリングとソフトスキルを駆使して信頼性を計測、コントロールすることです。
id:cohalz
- SRE
- 2018年入社
信頼性を制御し「サービス開発」を加速させる
サービス開発チームにジョインして開発/運用していく Embedded SRE は運用業務だけでなく、SREの原則に基づいたSLOの策定およびその先の開発速度を最大化するためにリーダーシップを発揮していくことが重要な仕事です。
自身のソフトウェアエンジニアリングとシステムエンジニアリングとソフトスキルを組み合わせつつ、プロダクトマネージャーやアプリケーションエンジニアを始めとした様々な職種の人と協力し、どうしたらサービスおよびチームのプロセスが改善されるかを考えるのが好きな方には特におすすめです。
SREのミッション
「エンジニアリングによって SLO に基づいた運用を実現し、一定の信頼性の下で開発速度を最大化する」
SREの仕事
はてなのSREを実現するEmbedded SREとPlatform SREという2つの応募ポジションを用意しておりますが、それぞれのポジションの業務内容などの説明を聞いて判断したい方のためにオープンポジションを用意しております。選考時に、経歴やチャレンジしたいことに応じて Embedded SRE もしくは Platform SRE を提案致します。
Embedded SRE
- サービス開発チームごとに異なりますが、スクラム開発を基本とした開発体制のもとで、アプリケーションエンジニアやプロダクトオーナーと共に、サービスのインフラ構築や運用を実践します。
- サービスのステークホルダーと連携しながらSLOを設定し、チームにとって最適な開発速度と信頼性のバランスを模索していきます。
Platform SRE
- 全社の共通システムの管理運用と改善を主な職掌としていますので、一定の運用業務と、改善プロジェクトを並行して進める形になります。
- サービス開発チームが少人数で構成されると、インフラ面をカバーする人間がいないことがあります。その場合、システムのライフサイクル全体で支援を行います。
- 幅広いスキル領域が必要となるため、チームでカバーしていくよう工夫しています。1人アサインを排するために必ず複数人のオーナーをタスクに設定したり、内部用のツール開発では運用したことのない技術要素を含めるといった取り組みです。採用強化もその一環です。
DevOps文化の醸成と推進
自ら主体的に行動し、プロダクトとユーザーのための技術選択を行っていただきたいです。
SREの原則に基づき、エンジニア・非エンジニア問わず職種を越えて協働することで、DevOps文化の醸成と推進を実行できる方のご応募をお待ちしています。
社員アンケート
- 一歩引いて、自分自身や取り組む問題を俯瞰する | はてなで働く hayajo_77 にアンケート [#5]
- 頑張らなくていいチームだからこそ自分の強みを増やしていきたい | はてなで働く do-su-0805 にアンケート [#8]
- SREはインフラ担当だけでなくチーム全体で取り組んでいくもの | はてなで働く cohalz にアンケート [#9]
- 異常なオープンネス文化が特徴的 | はてなで働く nabeop にアンケート [#11]
- kubernetesをキャッチアップし、知識を蓄積していく | はてなで働く masayosu にアンケート [#20]
SRE座談会
現在募集中のポジション
開発チーム・サービスごとの応募
オープンポジション
ご経験・ご希望に応じて、関わりたいチーム・サービスを選考の中で決定します。
オープンポジションの募集要項