大規模EC基盤の刷新とシステムの信頼性向上を担うSRE

概要詳細

■募集背景

弊社はファッション領域に特化し、AIおよびDXを活用したシステム開発やコンサルティングを展開しております。現在、親会社グループのEC事業において基盤のフルリプレイスを計画しており、要件定義から数年単位で進行する大規模プロジェクトとなります。
本プロジェクトおよび社内複数サービスの信頼性向上を目的として、SREを募集いたします。

■企業について

弊社はファッションと最先端テクノロジーを融合し、業界特化型のAI開発およびシステム構築を行うテクノロジーカンパニーです。EC事業、生成AI活用支援、教育向けワークショップなど多角的に事業を展開し、テクノロジーを通じて産業構造の高度化を推進しています。

職務内容

■業務内容

ECフルリプレイスに伴うインフラ構築
既存インフラの運用および保守対応
障害発生時の一次対応および原因調査
監視設定の実施および改善対応
開発チームと連携した運用改善対応

■チーム体制

プロジェクト全体約50名規模
10名以下のチーム単位で構成予定

求められるスキル

■必須スキル

Google Cloud環境でのインフラ設計および運用経験（2年以上）
IAMおよびVPCを含むセキュリティ設計の経験（2年以上）
SLI/SLO設計の経験（2年以上）
FinOpsおよびコスト最適化の経験（2年以上）
障害対応およびポストモーテム実施経験（2年以上）
負荷試験の設計および実施経験（2年以上）
Terraformを用いたInfrastructure as Codeの経験（2年以上）
PrometheusまたはDatadogを用いた監視設計の経験（2年以上）
Kubernetesを含むコンテナオーケストレーション基盤の運用経験（2年以上）
Amazon ECS on Fargate、Google Kubernetes Engine、Amazon Elastic Kubernetes Serviceなど複数基盤の特性理解および選定経験
CI/CDパイプラインの構築および運用経験（2年以上）