ぜひコメントやご意見お待ちしています
概要
ゆめみでは、
給与自己決定制度(公式ドキュメント) での給与決定が運用されています。下記ガイドラインに関わらず、人材市場評価・社内市場評価も勘案しながら、周囲からレビューをもらい最後は給与を自己決定をします。給与はえいやで決めるとしています。
また、「ガイドライン」とは、その定義から、それを参考にした上で本人が自己決定する手がかりでしかありません。チェックリストを満たしたら単純に給与が上がるというものではないですし、チェックリストを満たしていないから給与が上げられないわけでもありません。
細分化した役割、期待、能力を設定している理由としては、本人が自ら能力開発目標を立てるための助けになるとして設定もされています。
その上で、本ガイドラインを外部にオープンにする事により、業界においてエンジニアがより適正に評価され、能力開発が進む事を期待しますし、各社もオープングレードとして等級制度の内容をオープンにする流れが進むと良いと考えています。
前提
以下を参考・引用している。詳細な情報は以下へ飛んで確認してください。
またRDBやソフトスキルなどに関する内容を考慮し、アプリケーションエンジニア職位ガイドラインのチェックリストとセットで利用することを前提とします。
ゆめみでの職位
アソシエイト(年収目安 500万~580万)
Erik Stoltermanが提唱したDXの定義を知っている [1]
The digital transformation can be understood as the changes that digital technology caused or influences in all aspects of human life.
経済産業省のDXの定義を知っている [2]
企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確立すること
DXの推進に向けて企業や経営者が実施すべき事項を取りまとめた文書である「デジタルガバナンス・コード 2.0」の内容を説明でき、円滑にコミュニケーションできる [2]
Bill Inmonが提唱したDWH(統合された中央集権型アーキテクチャ)の内容を説明でき、円滑にコミュニケーションできる [3]
Ralph Kimballが提唱したdimensional modeling・star schemaの内容を説明でき、円滑にコミュニケーションできる [4]
Dan Linstedtが提唱したDataVolt(Scott AmblerのAgileを取り入れたデータマート開発のメソドロジー)の内容を説明でき、円滑にコミュニケーションできる [5]
hub
link
satellite
Zhamak Dehghaniが提唱したData Mesh(分散されたメッシュ型アーキテクチャ)の内容を説明でき、円滑にコミュニケーションできる [6]
CDP・CRM・DMP・MA・SFAとDWHの違いを説明でき、円滑にコミュニケーションできる [30]
DAMA-DMBoKで定められた11の知識領域の内容を説明でき、円滑にコミュニケーションできる [7][9]
Peter Aiken's framework のピラミッドの内容を説明でき、円滑にコミュニケーションできる
ゆずたそ氏の「データマネジメントが30分でわかる本」で書かれている内容を説明でき、円滑にコミュニケーションできる
11の知識領域
CMMI 協会のデータ管理成熟度モデルの内容を説明でき、円滑にコミュニケーションできる [8]
実施された
管理された
定義された
定量的に管理された
最適化している
ISO/IEC 25012(データそのものの品質)の内容を説明でき、円滑にコミュニケーションできる [9]
ISO/IEC 25024(データを使ったサービス実現プロセスに関する品質)の内容を説明でき、円滑にコミュニケーションできる [9]
ISO/TS 8000-61(データの整備から活用までの管理プロセスに関する品質)の内容を説明でき、円滑にコミュニケーションできる [9]
データ基盤に関するポストモーテムの内容を説明でき、対応ができる [27] [35] [36] [37]
dbtを利用した開発ができる
OLAP・OLTPの内容を説明でき、円滑にコミュニケーションできる
SQL・Pythonを利用したETLが実装できる
Mike JulianのPractical Monitoringの内容を説明でき、円滑にコミュニケーションできる [10]
apache airflowなどのワークフローツールを利用した開発ができる
John Boydが提唱したOODAの内容を説明でき、円滑にコミュニケーションできる [11] [12]
SSOT(Single Source of Truth)の内容を説明でき、円滑にコミュニケーションできる [13]
カラムナデータベースの内容を説明でき、円滑にコミュニケーションできる
TerraformなどのIaaSを利用したデータインフラが構築できる
Data Observabilityの5つの柱であるうちの一つであるData Lineageの内容を説明でき、円滑にコミュニケーションできる [23] [24]
DBのインデックスについて説明できる [31]
HDFS、Hadoop、MapReduceなどの分散システムの基礎知識について説明できる
RDB・NoSQL(Graph・KeyValue・WideColumn・Document)などのデータベースの違いについて説明できる
プロフェッショナル(年収目安 560万~670万)
Google Cloud Professional Data Engineerと同等の知識を持ち、実装できる
AWS Certified Big Data - Specialityと同等の知識を持ち、実装できる
dbt Analytics Engineering Certificationと同等の知識を持ち、実装できる
DAMA-DMBoKで定められた11の知識領域を考慮した設計ができる [7][9]
11の知識領域
個人情報・個人データの違いを理解し、パーソナルデータを適切に扱うことができる [26]
A Taxonomy of Privacyなどプライバシーデータに関するリスクの内容を説明でき、円滑にコミュニケーションできる [14] [15]
以下の6つのデータ品質評価軸を考慮した設計ができる [7] [9] [37]
適時性を考慮してSLA / SLO / SLIが設計できる [27][28]
以下の4つのデータセキュリティを考慮した設計ができる [7][9]
認証
認可
監査
保護
TerraformなどのIaaSを利用したデータインフラが設計できる
dbtを利用し、適切なデータモデリングができる [7][9][25]
概念レベル
論理レベル
物理レベル
pandera・dbt・great expectationsなどを用いてテストが実装できる
Singular tests
Generic tests
バッチ処理とストリーミング処理を適切に使い分けられる
ELTとETLを考慮した設計ができる [29]
パーティショニングなどのデータウェアハウスの最適化を考慮したDWHを設計できる
特定のステークホルダー・データオーナーとデータ連携できる
Data Lineageを意識したETL設計ができる [23] [24]
DataOps(自動化されたCICDなど)で開発できる [22]
カラムナなど適切なデータフォーマットを選択できる
Pub/SubやKafkaなどのメッセージキューを利用した分散システム設計ができる
Apache BeamやSpark、Hadoopなどの分散処理フレームワークを利用したストリーミング設計ができる
apache airflow・dagsterなどのワークフローツールを利用した設計ができる
冪等性を考慮したバッチ処理の設計ができる
Observabilityを考慮したデータパイプラインを設計できる
Meilisearch・Elasticsearchなどの検索エンジンを考慮した設計ができる
5つ以上のデータソースを統合した基盤が構築できる
3つ以上の異なるSLAを持ったデータソースを統合した基盤が構築できる
リーダー(年収目安 650万~950万)
DWHの選択など、要件にあった適切なシステム設計ができる
Data Activationの要件に沿って適切にreverse ETLを設計できる [21]
Data Contractを理解し、安全な基盤設計ができる [42]
要件に応じて適切にBI(LookerStudio・Tablaeu・Superset)を選択できる
新卒等にデータエンジニアリングに関してオンボーディングができる
市場動向を理解し、日頃から追従している
チームメンバーの能力を継続的に底上げする働きがけができる
三隅二不二氏が提唱した行動理論(スタイル論)に基づくPM理論を理解し、行動できる [33] [34]
チームをマネジメントし、OODA loopを回すことができる [11] [12]
dbtなどのデータエンジニアリングに関するOSSを開発に貢献できる
データ基盤の問題点を明確化し、継続的に改善できる
データビジネスにおいて、新たなData Integrationの提案等ができる [20]
様々なデータに対するドメイン知識がある
データエンジニアリングに関するOSSへの貢献ができている
ビジネス目的から要件を抽出してデータアーキテクチャを設計できる
グループダイナミクスにおける集団浅慮、集団圧力、社会的手抜きといった問題を理解した上で対策できている [38] [39]
コンフリクト(生産的・非生産的)を理解した上で、時に交渉することができる [40] [41]
シニア(年収目安 900万~1150万)
https://datatech-jp.github.io/ などで積極的に活動し、業界のデータエンジニアリング・データビジネスの発展に貢献している
テラバイト・ペタバイト級の規模のデータ基盤が設計・運用できる
派生職種(マルチスタック)
会社ごとに役割は異なりますが以下のスキルは市場価値が高く、マルチスタックの加点要素となります
アナリティクスエンジニア
データ分析の経験が3年以上ある
さまざまなステークホルダーを巻き込み、積極的かつ継続的なコミュニケーションをファシリテーションできる
データ品質を担保する設計ができる
データの異常・欠損などを監視できる
データのセキュリティを管理できる
データに対するビジネスロジックをテストで保証できる
データに関する継続的なドキュメンテーションができる
統一的なKPI・KGI指標の運用管理ができる
データドリブンにKPIの設計等の議論をファシリテーションできる
Evans, James Rが提唱した3つのアナリティクスを考慮した文化づくりができる [16] [17]
Descriptive Analytics
Predictive Analytics
Prescriptive Analytics
上記の3つのアナリティクスに加え、Gartnerが提唱した4つ目のアナリティクス「Diagnostic Analytics」を考慮した文化づくりができる [18]
MLOps エンジニア(機械学習エンジニア)
Google Cloud Professional Machine Learning Engineerと同等の知識を持ち、実装できる
AWS Certified Machine Learning - Specialtyと同等の知識を持ち、実装できる
Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015)の内容を考慮した設計ができる [19] [32]
データ・モデル・コードを適切にバージョン管理できる
モデルの品質管理を考慮した設計ができる
モデル負荷を考慮した設計ができる
embedding storeを設計できる
Amazon SageMaker Feature StoreやVertex AI Feature Storeを用いてfeature storeを設計できる
機械学習モデルのCICDを設計できる
機械学習モデルのPoCを開発できる
RMSE・AUC・DCG・IoU・BLEUなどの分野別のモデル評価指標を理解している
VertexAIやsagemakerのエコシステムを利用したモデル開発環境を構築できる
GCP・AWSのAutoMLを実装できる



