給非工程師的入門 · 教學筆記

網頁問答CLI 代理
該怎麼安全地把鑰匙交給 AI?

OpenAI Codex、Anthropic Claude Code、GitHub Copilot 等主流工具都已經提供 coding agent 型態的功能—— AI 不再只是回一段你自己貼回電腦的程式碼,而是直接在你的專案資料夾裡讀檔案、改檔案、執行命令、跑測試,甚至代你提出修改申請。 本文寫給完全沒寫過程式的讀者,帶你看清兩種工作模式的差別、優劣,與最關鍵的:怎麼一步步把權限放給它。

查核日期
2026 / 05 / 03
對象
完全沒寫過程式的人
閱讀時間
約 12 分鐘
引用來源
31 筆

01先記住這 5 個詞

// 把這幾個關鍵詞記住,後面比較不會卡。完整對照表在文末「小字典」。

CLI 命令列 黑底白字、要打字下指令的視窗。Mac 上叫「終端機」,Windows 是「PowerShell」或「命令提示字元」。
Agent 代理人 可以自己讀檔、改檔、執行指令的 AI 助手;不再只是回字。
Prompt 指令 你給 AI 的那一段話:你要什麼、有什麼限制、怎麼算完成。
Diff 修改對照 檔案改了哪幾行的「修改前 vs 修改後」對照表,用來檢查 AI 動了什麼。
Sandbox 沙盒 把 AI 關在一個畫好邊界的小房間裡,讓它只能動你允許的東西。

02一句話理解差別

// 兩種比喻,搭配一個可切換的小演示。

網頁問答式 AI coding 像「請人遠端寫一張便條」:你把需求或錯誤訊息貼進聊天框,AI 回一段說明或程式碼,你再自己複製到電腦、貼到檔案、執行、除錯。Merriam-Webster 將 vibe coding 定義為使用 AI 系統產生程式碼的行為

CLI agent 式 AI coding 則像「讓助手坐到你的工作桌前,但你決定要把鑰匙給多大」:AI 直接看你的專案檔案、修改檔案、執行命令、看測試結果,再把每一處改動列成 diff 讓你檢查

登入頁的按鈕點了沒反應,這段是哪裡有問題?
onClick={handleLogin}
你貼的這行看起來沒問題,可能是 handleLogin 沒被定義,或是 form 的 preventDefault 沒呼叫。請把 handleLogin 函式內容也貼上來,我才能進一步判斷。
[ 接下來你要自己回到編輯器、找出檔案、複製函式、再貼回聊天框⋯ ]
⟳ AI 看不到專案 · 你要當搬運工 · 來回複製貼上的迴圈
能看到你貼的片段
會做的事回字 / 寫範例
你要做手動執行驗證

03兩種工作模式的比較

// 五個面向、兩個欄位,看清楚差異在哪。

面向
網頁問答 / 複製貼上
CLI agent / 本機代理
你給 AI 的東西
主要是一段需求、一段錯誤訊息、或一段你貼上去的程式碼。
一整個專案資料夾,加上任務目標、限制條件、和「怎樣才算做完」的判準。
AI 會回給你什麼
通常是一段文字、解釋、或一小段程式碼,之後要你自己手動貼到電腦裡。
直接讀你的檔案、改你的檔案、執行命令;部分工具還能幫你管理程式版本、提交修改申請、做程式碼審查。
怎麼確認結果是對的
你要自己執行、自己看錯誤訊息、再把錯誤貼回去問。
可以叫 AI 自己跑測試、做格式檢查、把程式打包成可執行版本、截圖等等。
風險來源
AI 不會直接動你的檔案,但它寫的程式碼仍可能有 bug 或安全漏洞。
AI 可以直接改你的資料夾,「給它多大權限」變成最關鍵的安全問題。
適合什麼任務
適合問概念、看範例、做一次性的小工具或練習。
適合要讀整個專案、跨多個檔案修改、要跑測試、要反覆修正的任務。

04不是誰完全取代誰

// 兩條路各有所長,常常同一天裡前後都會用到。

網頁問答這種用法門檻最低、風險邊界也最清楚:你不用安裝工具、不用理解專案資料夾,AI 也碰不到你本機的檔案。對剛接觸的人來說,問個概念、請它解釋錯誤訊息、看一小段範例,通常用網頁問答就最快。

它的限制也是天生的:只看得到你貼上去的片段,看不到整個專案。一旦問題牽涉到多個檔案、設定、套件版本、測試結果,你就只能反覆複製貼上、自己當搬運工

CLI agent 走另一條路:它能待在你的工作現場,自己找檔案、執行測試、把改動列成可以逐行檢查的對照。代價是它能動真東西——權限開太大,誤刪檔案、外連網路、讀到秘密資訊都會變成實際風險。Codex 文件就把 danger-full-access 寫成「移除檔案系統與網路邊界」的模式

本文觀點 網頁問答適合學習、詢問、產生片段;CLI agent 適合真的要在一個專案裡完成改動。兩者並不衝突。

05本地 CLI agent 多做了什麼

// 真正的差別不在「答得比較聰明」,而在它能接觸完整脈絡。

CAP / 01

看到的是「整個現場」

真正卡住的問題常常不在你以為的那個檔案裡,而是藏在設定、路由、資料格式、套件版本、被別處呼叫的函式裡。CLI agent 會自己追線索,不必你猜該貼哪一段

CAP / 02

改完之後自己跑驗證

網頁問答只能把下一步寫給你看;CLI agent 可以直接執行測試、跑檢查、打包、看終端輸出,再根據結果繼續修

CAP / 03

每次改動都留可審查的痕跡

你不需要記得自己貼過哪幾段,只要看「哪些檔案被改、哪些行被改」。Codex CLI 有 /diff,Claude Code 在編輯器內顯示對照,GitHub Copilot 推成草稿 PR

CAP / 04

能記住專案規則

AGENTS.md / CLAUDE.md 寫下專案結構、測試命令、工程慣例與限制,每次對話開始時被讀取。寫一次,往後就不必每次重打一大段背景

CAP / 05

動手之前可以先畫好邊界

Codex 的 沙盒模式與 事前同意規則 控制能讀寫哪些地方、何時要先問你;Claude Code 的權限模式則提供從「只規劃」到「自動接受編輯」等不同層級。能動手不等於任由它動。

LEVEL 1 · 安全
read-only
只能讀,不能改
LEVEL 2 · 預設
workspace-write
只能改工作資料夾
LEVEL 3 · 危險
danger-full-access
全權放行(含網路)

06Codex 與 Claude Code 的差異

// 共通能力相同;依任務型態分流,再算訂閱划不划算。

// 共通能力

兩個工具都做得到

下面這些核心能力 Codex 與 Claude Code 都能勝任,選擇時不必為這些功能糾結

讀取整個專案、修改檔案、執行命令
把改動列成可逐行檢查的 diff
自動跑測試、lint、打包等驗證
規劃模式:先研究、提建議、不動程式碼
支援 斜線指令(如 /plan/diff
AGENTS.md / CLAUDE.md 記住專案規則
權限/邊界機制:先畫好範圍再放行
命令視窗 + VS Code 編輯器都可使用

兩者都不是單純聊天工具:都能讀專案、改檔案、執行命令、跑測試。

  1. 01

    創作、劇本、世界觀、Markdown 筆記

    Codex
    Claude
    偏 Claude

    雖然「比較有文采」是一種無法保證的說法。

    但對,Claude 就是比較有文采。

  2. 02

    程式除錯、修 bug、追根因

    Codex
    Claude
    GPT 優勢

    通用原則:先重現、再修、最後跑測試

    個人體感:GPT-5.5 在這塊略強於 Opus 4.7。

  3. 03

    規劃、拆任務、先想再做

    Codex
    Claude
    GPT 優勢

    通用原則:先規劃、計畫、再實作

    個人體感:GPT-5.5 在這塊略強於 Opus 4.7。

  4. 04

    提示詞遵循、長期規則、工作風格

    Codex
    Claude
    各擅其場
    • Codex寫入目標與結果,模糊之處 AI 會自動補全尋找最佳路徑。
    • Claude說什麼就做什麼,盡可能不做規範之外的事。

    兩者都不是「寫一次永遠完美遵守」;官方文件都建議規則寫清楚、可驗證、持續修正。

  5. 05

    視覺、設計、前端作品

    Codex
    Claude
    各擅其場
    • Claude搭配 Claude Design 快速生成設計版型。
    • Codex可以調用目前最強的圖片生成 image2。
// API 價格

標準 API 一樣便宜

以下是 API 直接呼叫的牌價,跟訂閱方案的「額度」不是同一回事。
GPT-5.5 Opus 4.7
Input / 1M tokens $5 $5
Output / 1M tokens $30 $25

直接打 API 兩家差不多,input 同價、output Claude 略便宜

Codex credits ChatGPT 內的 Codex 不是用美元計,而是換算成 credits;Fast mode 跑得快,但 GPT-5.5 會以 2.5× 速度燒 credits
Claude tokenizer Opus 4.7 支援 1M context、沒有長文 premium;但同一段文字在新 tokenizer 下可能膨脹 1.0–1.35×
// 訂閱方案

哪個訂閱夠你用?

下面是個人使用體感,不是官方保證額度。
  • ChatGPT Plus + Codex 輕度開發堪用

    單頁 HTML/CSS、小 bug、Markdown 整理、簡單腳本都做得來。實際可用訊息數會隨任務大小浮動

  • Claude Pro + Claude Code 只能算體驗版

    可以試流程、做小實驗,但不適合當日常主力。Pro 用戶想在 Claude Code 跑 Opus 4.7 可能要啟用 extra usage

  • Claude Max 5×(或更高) 主力從這起跳

    讀專案、規劃、除錯、連續改多個檔案就需要這層級;不夠再上 Max 20× 或 extra usage(以 API 牌價計)

普通人的選擇建議 先用你已經有帳號、付費方式清楚、自己作業系統能跑的那一個;一開始就把權限設成「只能讀」或「先計畫不動手」,或讓它「動手前先問你」;等你理解它在做什麼之後,再一格一格放寬。

07從網頁問答走向 CLI agent 的安全路線

// 六個步驟,從「只讀」一格一格放寬權限。

01

不要拿重要資料夾當第一次實驗

Codex 文件建議在任務前後建立 Git 檢查點 ——把目前狀態存檔,萬一 AI 弄壞了還能回到原狀。Claude Code 安全文件也明確說,使用者本人要負責審查每一個要核准的程式碼與命令

02

先請 AI 只讀不改

給足背景資訊,讓它先說它看到了什麼、不確定什麼。這符合官方「先探索,再規劃,最後才寫程式」的工作流程

03

請它先規劃再改檔

Codex CLI 的 /plan 斜線指令,與 Claude Code 的 規劃模式, 都會先研究並提出變更建議,不會直接動程式碼

04

把「完成條件」寫清楚

比起「幫我做一個登入功能」,更安全的說法是同時列出:只改必要檔案、不新增不必要套件、寫測試、執行測試、最後列出改了哪些檔案與理由

05

看修改對照(diff),不要只看摘要

Codex 的 /diff 顯示版本管理工具計算出的對照;Claude Code 在編輯器裡顯示 diff;GitHub Copilot 推成草稿版的 PR 方便人類審查

06

逐步放權限,不要一開始全開

Codex 的「全權放行」會移除「不能動檔案系統、不能連網」這些邊界;Claude Code 的「跳過所有權限詢問」也是同樣意思。等你完全理解工作範圍與風險之後再開

注意 AI 動手前必須得到你的明確授權。預設情況下不會自動執行;放寬之後請務必先了解 指令注入攻擊 的可能性。

08你可以直接拿去用的三段指令

// 直接複製貼到 Codex 或 Claude Code 都可以。

PROMPT 01 只讀理解專案
請先只讀,不要修改檔案,也不要執行會改變系統狀態的命令。
請用普通人聽得懂的方式說明這個專案:
- 它的用途
- 如何啟動
- 主要資料夾
- 可能的風險
- 你還需要我提供什麼資訊
PROMPT 02 先規劃,不實作
我要做的目標是:[填你的目標]請先進入規劃模式,不要修改檔案。
請找出相關檔案,提出最小可行方案,並列出:
- 會改哪些檔案
- 每個修改的理由
- 需要跑哪些測試
- 有哪些不確定或需要我決定的地方
PROMPT 03 小步實作並驗證
請依照剛剛的計畫實作,但保持最小變更。
限制:
- 不做無關重構
- 不新增不必要套件
- 不碰與任務無關的檔案
完成後請:
- 跑相關測試或檢查
- 顯示修改摘要
- 說明殘留風險
- 提醒我應該手動檢查什麼

三段指令是依據 Codex 與 Claude Code 最佳實務整理的模板;官方共同強調的元素:背景資訊、限制條件、完成判準、驗證、規劃模式、審查

09最短結論

TL ; DR

如果你完全不懂程式,最安全的升級路線不是把所有權限都一次交給 AI,而是從只讀開始:請它先讀懂、規劃、逐行確認修改對照、要求跑測試,再一格一格放寬權限。網頁問答讓你得到答案,CLI agent 讓 AI 進到你的工作現場——能做的事多了一截,要管的風險也跟著多了一截。

來源