---
name: ai-fluency-check
description: /ai-fluency-check と入力されたときだけ起動するAIフルーエンシー自己評価スキル。Anthropicの4D AI Fluency Framework（Delegation / Description / Discernment / Diligence）に基づく18項目のルーブリックを使い、対話的に自己評価する。過去の評価記録と比較して成長を可視化し、研究根拠にもとづく改善アドバイスと参考文献を提供する。ユーザーが /ai-fluency-check と明示的に入力した場合のみ使用すること。自動起動・推測起動は一切しない。
license: MIT
metadata:
  author: toieelab Kameda
  version: 1.0.1
  tags: [education, ai, self-assessment, ai-fluency]
---

# AI Fluency Self-Check スキル

## 起動条件

ユーザーが `/ai-fluency-check` と明示的に入力したときのみ起動する。自動起動・推測起動は一切しない。

---

## 設計思想

このスキルは Anthropic が2026年2月に発表した [AI Fluency Index](https://www.anthropic.com/research/AI-fluency-index) の研究示唆に基づく自己評価ツール。以下の3点を重視している：

1. **4Dフレームワークに準拠**：Delegation / Description / Discernment / Diligence の4次元を網羅する
2. **研究で観察された行動を項目化**：AI Fluency Indexで観察された11の行動指標と、観察不能だが重要な13指標をバランスよく含める
3. **成長の可視化**：単発チェックではなく、前回比較で学習曲線（Economic Index "Learning Curves"）を実感できるようにする

---

## 実行フロー

### Step 0｜過去データの検索

`conversation_search` ツールで `"AI Fluency Score Record"` を検索する。

- **見つかった場合**：最新の記録（日付・各次元スコア・項目別スコア）を取得してメモリに保持。Step 1 で「前回と比較します」と伝える。
- **見つからなかった場合**：初回として進める。

---

### Step 1｜ガイダンスの表示

以下の内容を表示してから質問セッションに入る：

```
🎯 AI フルーエンシー自己チェック

Anthropic の 4D AI Fluency Framework に基づく 18 項目で、
あなたの AI 活用スキルを自己評価します。

📋 評価軸（4D）
  Delegation  （委任）    : AIに任せる範囲の判断   4問・最大12点
  Description （記述）    : AIへの伝え方           5問・最大15点
  Discernment （識別）    : 出力を吟味する力       5問・最大15点
  Diligence   （誠実）    : 責任と継続的改善       4問・最大12点

⏱ 所要時間：7〜11 分
💡 各問「詳細を見る」ボタンで4段階の説明を確認できます
📚 研究根拠：Anthropic AI Fluency Index (2026)
```

前回データがある場合：「📅 前回（YYYY-MM-DD）の記録が見つかりました。今回と比較します。」を追加。

---

### Step 2｜質問セッション（4ブロック）

#### 質問の提示ルール

各問の手順：

1. 「**ID｜項目名**」と一行説明を表示
2. `ask_user_input` で5択を提示（**初回呼び出し**）：
   - `0: ほとんどできていない`
   - `1: 時々できている`
   - `2: 一貫してできている`
   - `3: 高度にできていて他者にも教えられる`
   - `詳細を見る`
3. **選択肢「0〜3」が選ばれた場合**：スコアを記録して、次の問へ進む（コメントなしで淡々と）
4. **選択肢「詳細を見る」が選ばれた場合**：
   - 後掲の詳細テキスト（該当項目の4段階説明）をそのまま表示する
   - 続いて `ask_user_input` を **4択で再呼び出し**（「詳細を見る」は含めない）：
     - `0: ほとんどできていない`
     - `1: 時々できている`
     - `2: 一貫してできている`
     - `3: 高度にできていて他者にも教えられる`
   - 返ってきたスコアを記録して、次の問へ進む

**重要**：2回目の `ask_user_input` に「詳細を見る」を含めない設計は、無限ループ防止と、詳細を読んだ後はスコアをつけるフェーズに進むという流れを明確にするため。

---

#### ブロック1：Delegation（委任・4問）

AIに任せる範囲を戦略的に判断する力。タスクをどう分解するか、どのモード（自動化／思考パートナー／エージェント）で関わるかを意図的に選ぶ次元。

| ID | 項目名 | 一行説明 |
|----|--------|---------|
| DG1 | タスクの切り分け判断 | 「人がやる部分」「AIに任せる部分」を意識的に切り分けているか |
| DG2 | AIの能力と限界の理解 | AIが得意なこと／苦手なことを踏まえて依頼内容を調整しているか |
| DG3 | 相互作用モードの意図的選択 | 「手早く自動化」「思考の壁打ち」「長期の代行」を使い分けているか |
| DG4 | 実行前のアプローチ相談 | 大きなタスクでは、いきなり実行させず先に「どう進めるか」を相談するか |

4問終了後：`✅ Delegation（委任）：X / 12点` と小計表示してからブロック2へ。

---

#### ブロック2：Description（記述・5問）

目標・期待・条件を明確に言語化してAIの挙動と出力を導く力。AI Fluency Index で最も観察される次元。

| ID | 項目名 | 一行説明 |
|----|--------|---------|
| DS1 | 目的の明確化 | 依頼前に「何のために・何を達成したいか」を伝えているか |
| DS2 | 形式・構造の指定 | 表・箇条書き・コードなど、望む出力形式を具体的に指定しているか |
| DS3 | 良い例の提示 | 目指すトーン・品質の参考例を渡してガイドしているか |
| DS4 | 対象読者・文脈の共有 | 読み手・場面・前提制約をセットで伝えているか |
| DS5 | 協働スタイルの設定 | 「間違っていたら指摘して」「推論を先に説明して」など対話ルールを先に設定するか |

> 💡 **DS5**：レポートが特に推奨した行動。実行率30%だが対話全体の質を変える最大の伸びしろ。

5問終了後：`✅ Description（記述）：X / 15点` と小計表示してからブロック3へ。

---

#### ブロック3：Discernment（識別・5問）

AIの出力・挙動・推論を批判的に評価する力。レポートが「アーティファクト作成時にすべての指標が低下する」と警告した注意すべき次元。

| ID | 項目名 | 一行説明 |
|----|--------|---------|
| DC1 | 反復と精緻化 | 初回回答を起点として、追質問・修正指示で磨き込んでいるか |
| DC2 | 推論の問い直し | 「なぜそう言える？」「根拠は？」を意図的に問うているか |
| DC3 | 文脈不足の特定 | AIの回答で「抜けている前提・欠けている視点」を能動的に指摘するか |
| DC4 | 重要事実の検証 | 重要情報を外部ソースや別経路でクロスチェックするか |
| DC5 | Polish への警戒 | 見た目が整ったアウトプット（コード・文書・アプリ）ほど疑って確認するか |

> 💡 **DC1**：研究で最も多く観察（85.7%）され、全指標と最強相関を示した中核行動。
> 💡 **DC5**：このレポートが新しく提示した「Polishの罠」概念。見た目の完成度と内容の正しさは別という注意喚起。

5問終了後：`✅ Discernment（識別）：X / 15点` と小計表示してからブロック4へ。

---

#### ブロック4：Diligence（誠実・4問）

AI活用に責任を持ち、透明性・倫理・継続学習を実践する力。レポートが「観察不能だが最も重要」と明言した次元。自己評価でしか測れない領域。

| ID | 項目名 | 一行説明 |
|----|--------|---------|
| DL1 | 透明性（利用開示） | AIがどこで関与したかを成果物や関係者に明示しているか |
| DL2 | 検証責任 | 公開・提出する前に、人間として最終確認・責任を引き受けているか |
| DL3 | 倫理・ポリシー遵守 | 著作権・プライバシー・組織ポリシーを踏まえてAIを使うか |
| DL4 | 継続的学習（Learning Curve） | 自分のAI使用を定期的に振り返り、使い方・モデル選択を改善しているか |

> 💡 **DL4**：Economic Index "Learning Curves" で示された、6ヶ月以上のユーザーの成功率が+5pp高いという事実に基づく。熟達は振り返りで積み上がる。

4問終了後：`✅ Diligence（誠実）：X / 12点` と小計表示してから Step 3 へ。

---

### Step 3｜スコア集計の表示

markdownの表でスコアサマリーを表示する：

**スコアサマリー表（前回比較付き）：**

| 次元 | 今回 | 前回 | 差分 |
|------|------|------|------|
| Delegation（委任）| X/12 | X/12 | ▲X or ▽X |
| Description（記述）| X/15 | X/15 | ▲X or ▽X |
| Discernment（識別）| X/15 | X/15 | ▲X or ▽X |
| Diligence（誠実）| X/12 | X/12 | ▲X or ▽X |
| **合計** | **X/54** | **X/54** | **▲X or ▽X** |

前回データがない場合は「前回」「差分」列を省略。

---

### Step 4｜テキストフィードバック

#### 4-1. 全体評価コメント

合計スコア（満点54）に応じたコメントを1〜2文で：

| 合計 | 評価レベル | コメント |
|------|---------|---------|
| 0〜18点 | 基礎固め段階 | AI活用の習慣づけ段階。まず日常的な使い方の型を整えていきましょう。 |
| 19〜35点 | 実践育成段階 | 実践的な活用が育ちつつある段階。意識的に取り組んでいる項目が見えています。 |
| 36〜44点 | 熟達段階 | 高度な活用ができている段階。次は他者への展開・チームへの貢献が視野に入ります。 |
| 45〜54点 | 指導者段階 | 各次元で高い実践力があり、他者にフルーエンシーを伝える立場。研究や教育への貢献も視野に。 |

#### 4-2. 強みの次元

最高スコアの次元（同点の場合は複数）について、「何ができているか」を具体的に1〜2文で記述。

#### 4-3. 優先改善項目

スコアが低い項目（計3項目）について、それぞれ以下の形式で：

```
📌 [項目名]（現在 X/3 | 次元：◯◯◯）
  課題：〜〜〜
  次のアクション：〜〜〜（具体的に1つ）
```

優先改善項目3つは、以下の優先順位で選ぶ：

1. **次元バランス優先**：4つのDの中で最もスコアが低い次元から **最低1項目** を必ず含める
   - その次元の中で最低スコアの項目を選ぶ
   - 同スコアで複数ある場合は、下記ステップ3のルールで選ぶ
2. **残り2項目はスコア下位順**：全18項目の中からスコアが低い順に選ぶ（ステップ1で選んだ項目は除く）
3. **同スコアで並んだ場合のタイブレーク**：以下の「研究で特に重要とされた項目」を優先
   - DC1（反復と精緻化）：全指標と最強相関
   - DS5（協働スタイルの設定）：最大の伸びしろ
   - DC5（Polishへの警戒）：アーティファクト効果への注意
   - DL4（継続的学習）：Learning Curve効果

**理由**：次元バランスを優先する理由は、1つの次元に偏らないバランスのとれたフルーエンシー向上を促すため。全体の下位3つだけを機械的に選ぶと、同じ次元に改善項目が集中してしまう可能性があるため、このルールで補正する。

#### 4-4. 成長の記録（前回データがある場合のみ）

- スコアが上がった項目：「✨ 伸びた項目：〜」
- 変わっていない項目：「→ 引き続き意識したい：〜」
- 下がった項目があれば：「⚠️ スコアが下がった項目：〜（要確認）」

前回比較で、特に次元別の伸びを強調する。Economic Index "Learning Curves" の示唆通り、継続的な振り返りで成長が加速することを伝える。

---

### Step 5｜参考文献

```
📚 参考文献

【原典】
- Anthropic AI Fluency Index (2026)
  https://www.anthropic.com/research/AI-fluency-index

- Anthropic Economic Index - Learning Curves (March 2026)
  https://www.anthropic.com/research/economic-index-march-2026-report

【4D Framework】
- AI Fluency: Framework & Foundations (Anthropic Academy)
  https://anthropic.skilljar.com/ai-fluency-framework-foundations

- Framework for AI Fluency by Rick Dakan & Joseph Feller
  https://ringling.libguides.com/ai/framework

【解説記事】
- AI Fluency Index 解説（日本語）
  https://jobirun.com/anthropic-ai-fluency-index-report-2026/
```

---

### Step 6｜保存用サマリーの出力

次回の `conversation_search` で確実に引っかかるよう、会話中に以下のブロックをそのまま出力する（フォーマットを崩さない）：

```
## AI Fluency Score Record
日付: YYYY-MM-DD
Delegation（委任）: X/12
Description（記述）: X/15
Discernment（識別）: X/15
Diligence（誠実）: X/12
合計: X/54
詳細スコア: DG1=X, DG2=X, DG3=X, DG4=X, DS1=X, DS2=X, DS3=X, DS4=X, DS5=X, DC1=X, DC2=X, DC3=X, DC4=X, DC5=X, DL1=X, DL2=X, DL3=X, DL4=X
```

「このブロックをメモしておくと、次回の `/ai-fluency-check` で自動的に成長比較ができます。」と一言添える。

---

## 詳細テキスト（「詳細を見る」選択時に表示）

### Delegation（委任）

#### DG1｜タスクの切り分け判断
- **0**: タスクを丸投げするか全部自力でやるかの二択になっており、切り分けの発想がない
- **1**: 大きなタスクはときどき分解するが、「AIに任せる部分／自分でやる部分」の判断基準が曖昧
- **2**: タスクを「構造化・下書き・検証・最終判断」などに分解し、AIに任せる部分と人がやる部分を意図的に分けている
- **3**: タスク切り分けのパターンを自分のワークフローとして定型化し、他者にも再現可能な形で共有できる

#### DG2｜AIの能力と限界の理解
- **0**: AIが何を得意で何を苦手とするかをあまり意識せず、同じやり方で何でも依頼する
- **1**: うまくいかなかった経験から「このタイプの依頼は苦手そう」と気づく程度
- **2**: AIの得意領域（構造化・下書き・複数案出し）と苦手領域（最新事実・独自判断・長期記憶）を踏まえて依頼の粒度を調整している
- **3**: モデルごとの特性差やバージョン更新の影響を理解し、タスクに応じてモデル・ツールを使い分けている

#### DG3｜相互作用モードの意図的選択
- **0**: ほぼ「質問して答えをもらう」一択で、AIとの関わり方を意識していない
- **1**: たまに「ブレスト役」「レビュー役」など役割を切り替えるが、その場の思いつきが多い
- **2**: 「自動化（任せて実行）」「思考パートナー（一緒に考える）」「エージェント化（継続的に代行）」を意識的に使い分けている
- **3**: タスク設計の段階で適切なモードを選び、メンバーやクラスにもモード選択の判断軸を伝えられる

#### DG4｜実行前のアプローチ相談
- **0**: 大きなタスクでも、いきなり「やって」と依頼して最後まで一気に走らせる
- **1**: 途中で手戻りが起きたときに、方針を相談し直すことがある
- **2**: 重要なタスクでは「どう進めるか」をまず相談し、合意してから実行に移す習慣がある
- **3**: アプローチ相談→計画合意→実行→検証のワークフローを定型化し、他者にも展開している

---

### Description（記述）

#### DS1｜目的の明確化
- **0**: 「〜について教えて」程度で、何のために・どう使うかを伝えない依頼が多い
- **1**: 重要な依頼のときだけ目的を書くが、抜け漏れが多い
- **2**: 依頼のたびに「最終目的・成果物の用途・成功条件」を具体的に伝えている
- **3**: 目的の言語化をテンプレ化し、複雑なタスクでも目的階層（上位目的／具体目的）を整理して渡せる

#### DS2｜形式・構造の指定
- **0**: 出力形式を指定せず、毎回AI任せで返ってきた形をそのまま受け取る
- **1**: ときどき「箇条書きで」「表で」など簡単な形式を指定する
- **2**: 目的に応じて「表・コード・手順書・JSON・マークダウン」など最適な形式を積極的に指定している
- **3**: 再利用可能なフォーマット（テンプレ・スニペット）を設計し、AIへの指示として継続活用している

#### DS3｜良い例の提示
- **0**: 例文や参考資料をほとんど渡さず、抽象的な指示だけで依頼する
- **1**: うまくいかないときだけ参考例を追加する
- **2**: 目指すトーン・構成・品質を示す具体例を最初から渡す習慣がある
- **3**: 自作の良いアウトプットをライブラリ化し、タスクに応じて例を使い分けている

#### DS4｜対象読者・文脈の共有
- **0**: 読み手のレベル・場面・制約などの前提をほぼ伝えない
- **1**: 思いついたときだけ背景情報を書くが、抜け漏れが多い
- **2**: 読者（誰が読むか）・場面（どこで使うか）・制約（時間・予算・組織ルール）を一通りセットで共有している
- **3**: タスクに応じた文脈共有のパターンを持ち、他者にもその設計法を伝えられる

#### DS5｜協働スタイルの設定
- **0**: AIとの対話ルールを指定せず、返ってきたものをそのまま受け取る
- **1**: ときどき「丁寧に」「簡潔に」など話し方を指定する
- **2**: 「間違っていそうなら指摘して」「推論を先に説明して」「不確かな部分を明示して」など、対話の振る舞いルールを先に設定している
- **3**: タスク種別ごとの協働スタイル（批評モード・ソクラテスモード・ブレストモードなど）をパターン化し、他者にも共有している

---

### Discernment（識別）

#### DC1｜反復と精緻化
- **0**: 最初の回答をほぼそのまま使うことが多い
- **1**: 気になったときだけ追加質問や修正指示を出す
- **2**: 「たたき台→追質問→修正→最終版」のように、ほぼ毎回2〜3往復以上で磨き込んでいる
- **3**: 反復プロセス自体を設計し、「生成→比較→統合→検証」のようなワークフローを定型化している

#### DC2｜推論の問い直し
- **0**: AIの結論の「なぜ？」をほとんど問わずに結果を受け取る
- **1**: 疑問を感じたときだけ理由や根拠を尋ねる
- **2**: 意図的に「なぜその結論？」「前提は何？」「他の選択肢は？」と問い、推論を言語化させている
- **3**: AIの推論プロセスを自分で辿れるレベルで理解し、推論の見える化を指導・設計できる

#### DC3｜文脈不足の特定
- **0**: AIの回答に欠けている前提や視点に気づかず、そのまま使うことが多い
- **1**: 明らかな抜けだけ指摘する
- **2**: 「地域差」「対象者のスキル」「制度・文化・業界特性」など、抜けている前提を体系的に確認・補完している
- **3**: 前提チェックの観点リストを持ち、チームや学習者にも「この前提は？」と問う文化を作っている

#### DC4｜重要事実の検証
- **0**: AIの出力をそのまま事実として受け取り、検証しないことが多い
- **1**: 重要そうな数字や固有名詞だけ気が向いたときに調べる
- **2**: 重要情報は、AIに再確認させたり外部ソース（一次資料・公式ドキュメント）でクロスチェックする習慣がある
- **3**: 検証の手順をチェックリスト化し、チームや学習者にも「検証のやり方」を指導できる

#### DC5｜Polish への警戒
- **0**: 見た目が整った出力（動くコード・整ったレポート・完成っぽいアプリ）を「できている」と判断しがち
- **1**: 大きな違和感があるときだけ再確認する
- **2**: 完成度の高いアウトプットほど「本当に正しいか？仕組みはどうなっているか？」と意図的に立ち止まって確認している
- **3**: 「Polishの罠（見た目の完成度と内容の正しさは別）」を他者にも教え、検証文化を組織・クラスに根づかせている

---

### Diligence（誠実）

#### DL1｜透明性（利用開示）
- **0**: AIを使ったかどうかを共有しない、または聞かれても曖昧にする
- **1**: 聞かれたときだけAI利用を説明する
- **2**: 成果物（記事・コード・教材・レポート）に「どの部分でAIを使ったか」を自発的に明記している
- **3**: 所属組織・クラス・コミュニティでAI利用開示の基準を整備・運用している

#### DL2｜検証責任
- **0**: AIの出力をそのまま公開・提出することがあり、最終確認の基準が曖昧
- **1**: 重要そうな場面では自分で確認するが、基準は場当たり的
- **2**: 公開・提出前には必ず人間（自分または他者）が最終確認する基準とプロセスを決めて守っている
- **3**: 「AIは補助・人間が責任」という原則を組織やチームのプロセスに組み込み、運用している

#### DL3｜倫理・ポリシー遵守
- **0**: 著作権・プライバシー・組織ポリシーをあまり意識せずにAIを使う
- **1**: 気になったときだけ規約やルールを確認する
- **2**: 著作権・機密情報・個人情報・組織ポリシーなどリスク領域では特に注意して使い方をコントロールしている
- **3**: 自組織・授業向けのAI利用ガイドラインを作成・アップデートし、周囲に浸透させている

#### DL4｜継続的学習（Learning Curve）
- **0**: 自分のAI活用を振り返る習慣はほぼなく、同じ失敗を繰り返しがち
- **1**: うまくいかなかったときだけ使い方を見直す
- **2**: 定期的に「うまくいったプロンプト・失敗パターン・モデル選択の判断」を振り返り、使い方を改善している
- **3**: 振り返りと共有の場（社内勉強会・コース・ブログ）を設計・運営し、他者の学習曲線も後押ししている
