概要詳細
■募集背景
弊社はファッション領域に特化し、AIおよびDXを活用したシステム開発やコンサルティングを展開しております。現在、親会社グループのEC事業において基盤のフルリプレイスを計画しており、要件定義から数年単位で進行する大規模プロジェクトとなります。
本プロジェクトおよび社内複数サービスの信頼性向上を目的として、SREを募集いたします。
■企業について
弊社はファッションと最先端テクノロジーを融合し、業界特化型のAI開発およびシステム構築を行うテクノロジーカンパニーです。EC事業、生成AI活用支援、教育向けワークショップなど多角的に事業を展開し、テクノロジーを通じて産業構造の高度化を推進しています。
職務内容
■業務内容
- ECフルリプレイスに伴うインフラ構築
- 既存インフラの運用および保守対応
- 障害発生時の一次対応および原因調査
- 監視設定の実施および改善対応
- 開発チームと連携した運用改善対応
■チーム体制
- プロジェクト全体約50名規模
- 10名以下のチーム単位で構成予定
求められるスキル
■必須スキル
- Google Cloud環境でのインフラ設計および運用経験(2年以上)
- IAMおよびVPCを含むセキュリティ設計の経験(2年以上)
- SLI/SLO設計の経験(2年以上)
- FinOpsおよびコスト最適化の経験(2年以上)
- 障害対応およびポストモーテム実施経験(2年以上)
- 負荷試験の設計および実施経験(2年以上)
- Terraformを用いたInfrastructure as Codeの経験(2年以上)
- PrometheusまたはDatadogを用いた監視設計の経験(2年以上)
- Kubernetesを含むコンテナオーケストレーション基盤の運用経験(2年以上)
- Amazon ECS on Fargate、Google Kubernetes Engine、Amazon Elastic Kubernetes Serviceなど複数基盤の特性理解および選定経験
- CI/CDパイプラインの構築および運用経験(2年以上)
■歓迎スキル
- 大規模トラフィック環境におけるインフラ運用経験
- 設計書、運用手順書、ポストモーテムなどのドキュメント作成経験
- 開発チームと連携したインフラ改善および信頼性向上の経験
- 自動化および運用効率化の推進経験