
CursorやClaude CodeのようなAI高機能エディタを使っていると、コードを書く作業そのものよりも、AIにどう指示するかが重要になっていると感じることがあります。
以前であれば、関数名や処理内容をキーボードで少しずつ入力していました。
しかしAIエディタでは、長めの指示を自然文で伝える場面が増えています。
そこで気になったのが、Cursorに音声入力を組み合わせる方法です。
結論からお伝えすると、まずはWindowsならWindows + H、Macなら標準音声入力から試すのがおすすめです。
短い日本語の指示であれば、OS標準の音声入力だけでもCursorにプロンプトを入れられます。
ただし、TypeScript、React、mapのような技術用語が混ざると、カタカナになったり、意図と違う言葉になったりすることがあります。
そのため、長いプロンプトを何度も入力するなら、SuperWhisperのような専用ツールやCursor側のRules設定も検討すると使いやすくなります。
この記事では、Cursorで日本語の音声入力を快適に使うための設定、ツール選び、実務で使いやすいワークフローまでをご紹介します。
Cursorで音声入力を使うと開発作業が速くなる理由
タイピング中心からAIへの指示中心に変わっている
CursorやClaude CodeをはじめとするAI高機能エディタが広がったことで、開発作業の進め方は大きく変わっています。
以前は、コードを1行ずつ自分で書き、必要に応じて検索し、エラーを読みながら修正する流れが中心でした。
しかし今は、AIに対して次のような指示を出す場面が増えています。
-
この処理を非同期関数にして
-
このコンポーネントを分割して
-
例外処理を追加して
-
TypeScriptの型を明示して
-
重複している処理を共通化して
つまり、作業の中心が単なるタイピングではなく、AIに伝えるためのプロンプト設計へ移ってきています。
この変化を考えると、長い指示を毎回キーボードで入力するのは、少しもったいないです。
たとえば、
この関数にユーザーIDを渡して、APIからプロフィール情報を取得し、失敗した場合はエラーメッセージを返すようにして
という指示を入力するだけでも、キーボードでは意外と時間がかかります。
一方で、音声入力なら同じ内容を数秒で伝えられます。
僕も最初はWindowsのWindows + Hだけで試しましたが、短い日本語であれば普通に入力できました。
ただ、TypeScriptやReact、mapなどが混ざると、意図した英語表記にならないことがあります。
それでもCursor側がコードの文脈を読んでくれるため、完全に整えなくても使える場面は多いと感じました。
CursorのようにAIとの対話が前提になっているエディタでは、音声でプロンプトを作れるかどうかが、作業スピードに直結しやすいです。
日本語のまま長い指示を出せるのが大きなメリット
Cursorで音声入力を使うときに大事なのは、ただ文字を入力できることではありません。
特に重要なのは、日本語のまま長い指示を出せることです。
開発中の会話では、日本語の中に関数名、変数名、フレームワーク名、メソッド名などの英語が混ざります。
たとえば、次のような指示です。
このmap処理をfor文に変えて。
Next.jsのAPIルートを追加して。
TypeScriptで型を定義して。
このように、日本語と英語が混ざるのは開発作業では普通です。
そのため、音声入力ツールを使うなら、日本語だけでなく、英単語や技術用語もある程度自然に認識できることが大切です。
ただし、音声入力に完璧な変換を求めすぎると、逆に使いにくくなります。
僕の場合も、「map」とだけ言うより、
mapという配列メソッドを使って
と話したほうが通りやすく感じました。
また、「React」も英語っぽく発音するより「リアクト」と言い、そのあとに「コードではReactと書いて」と補足すると、Cursorに意図が伝わりやすくなりました。
多少の言い間違いや口語表現があっても、Cursor側のAIが前後のコード文脈を見ながら意図を補完してくれれば、手動で細かく直す必要が減ります。
OS標準の音声入力だけで十分な場面もありますが、日本語の認識精度や技術用語の扱いやすさを考えると、SuperWhisperのような専用ツールを使ったほうが快適になることもあります。
音声入力と生成AIを組み合わせると指示出しがスムーズになる
音声入力の最大の強みは、思考のスピードに近い形で指示を出せることです。
キーボードで、
ここをこう修正して、ついでに例外処理も追加して、戻り値の型も明示して
と書こうとすると、途中で考えが途切れることがあります。
手を動かしている間に、
「あれ、さっき何を追加したかったんだっけ?」
となることもありますよね。
音声入力であれば、コードを見ながらその場で説明できます。
たとえば、Cursorのインライン編集を開いて、次のように話すだけです。
この関数をTypeScriptで型安全に書き直して。引数にはユーザーIDを受け取って、データ取得に失敗した場合はtry-catchでエラーを処理して。戻り値の型も明示して。
僕が特に楽だと感じたのも、リファクタリングやエラー解析のような長めの指示でした。
たとえば、
この関数にtry-catchを追加して、戻り値の型も明示して、エラー時はnullを返すようにして
くらいの文章は、打つより話したほうが明らかに楽でした。
特にCursorはコードの文脈を見ながら修正案を出してくれます。
そのため、音声入力でざっくり伝えても、かなり実用的な出力につながります。
「言い淀み」があってもAIが補正してくれる
音声入力では、「えっと」「あー」「このへんを」「さっきの処理を」など、話し言葉特有の表現が混ざります。
普通の文章作成であれば後から削除したくなるかもしれませんが、CursorのAIに渡すプロンプトとして使う場合は、多少のノイズがあっても問題になりにくいです。
Claudeのような高性能なAIモデルは、口語表現や多少の誤字脱字を、前後の文脈から読み取ってくれます。
たとえば、音声入力で次のように入ったとします。
あー、えっと、この下のbuttonタグのところにクリックイベントを追加して、handleClickを呼び出すようにしてくれますか。
この文章を手動で整えるなら少し手間ですが、AIに渡すだけなら十分です。
Cursorはコードを見ながら、buttonにonClick={handleClick}を追加する意図だと理解しやすいです。
つまり、音声入力では完璧な文章を作る必要はありません。
AIに伝わる程度の情報を、できるだけ速く渡すことが大事です。
ただし、関数名や変数名そのものが別の言葉に変換されている場合は、そのまま送らないほうが安全です。
口語のノイズは多少残ってもよいですが、コード上の名前や処理内容が変わっている場合は、送信前に一度確認しておきましょう。
作業が速くなるポイントは「長い指示」を声で出せること
音声入力が効果を発揮するのは、特に長い指示を出す場面です。
1文字だけ直す、変数名を微調整する、インデントを整えるといった作業は、キーボードのほうが速いこともあります。
僕も実際に使ってみて、1文字の修正や変数名の変更は、音声入力よりキーボードのほうが速いと感じました。
音声入力は、キーボードを完全に置き換えるものではありません。
しかし、30文字以上の指示や、複数条件を含む修正内容を伝える場合は、音声入力のほうがかなり楽です。
たとえば、以下のような指示です。
このAPI呼び出し部分をリファクタリングして、成功時と失敗時の処理を分けてください。エラー時には画面にメッセージを表示し、ローディング状態も正しく解除されるようにしてください。
この長さをタイピングするのは面倒ですが、声なら一息で伝えられます。
Cursorで音声入力を使う価値は、まさにここにあります。
Windows・MacでCursor音声入力を使うための基本設定
Cursorをインストールして準備する
CursorはVSCodeをベースにしたAIエディタです。
まずは公式サイトからインストーラーを取得し、通常のアプリと同じようにインストールします。
Macの場合は、.dmgファイルをダウンロードして展開し、Cursorのアイコンを「アプリケーション」フォルダに移動します。
Windowsの場合は、.exe形式のインストーラーを実行し、画面の案内に沿ってセットアップします。
Cursor自体のインストールが終わったら、次に確認したいのはマイク権限です。
音声入力は、OS側のマイク許可がないと動きません。
そのため、Cursorだけをインストールしても、すぐに使えない場合があります。
Cursorに直接マイク機能を求めるというより、OS標準の音声入力や外部ツールで文字を入力し、その文字をCursorのチャット欄やインライン編集欄に流し込むと考えると分かりやすいです。
Macでマイク権限と音声入力を設定する
MacでCursorに音声入力する場合は、まず「システム設定」を開きます。
「プライバシーとセキュリティ」から「マイク」を選び、Cursorにマイクのアクセス権限が付与されているか確認しましょう。
SuperWhisperなどの外部ツールを使う場合は、そのツールにもマイク権限を許可します。
Mac標準の音声入力を使うなら、「キーボード」設定の中にある「音声入力」をオンにしておくと便利です。
Macでは、音声入力の言語やマイクソースも変更できます。
日本語でCursorに指示を出すなら、音声入力の言語が日本語になっているか、使いたいマイクが選ばれているかも確認しておきましょう。
ショートカットは環境によって異なりますが、fnキーを2回押す設定にしておくと、Cursorのチャット欄やインライン編集欄で素早く音声入力を始められます。
CursorでCmd + Kを押してインライン編集を開き、その状態でMacの音声入力を起動すれば、日本語でプロンプトを入力できます。
また、Cmd + LでAIチャットを開いてから音声入力する使い方も便利です。
Windowsでマイク権限と音声入力を設定する
Windowsでは、「設定」から「プライバシーとセキュリティ」を開き、「マイク」の項目を確認します。
ここで次の設定を確認しておきましょう。
-
「アプリがマイクにアクセスできるようにする」をオン
-
「デスクトップ アプリがマイクにアクセスできるようにする」をオン
Cursorはデスクトップアプリとして扱われるため、この設定が無効になっていると音声入力が反応しないことがあります。
Windows標準の音声入力は、Windowsキー + Hで起動できます。
Cursorのチャット欄や編集欄にカーソルを置いた状態でこのショートカットを押すと、話した内容をテキストとして入力できます。
Windowsの音声入力は日本語にも対応していますが、Windows 11ではオンライン音声認識を使う仕組みになっています。
そのため、仕事のコードや機密情報を含む内容を話す場合は、音声データや入力内容の扱いも確認しておいたほうが安心です。
ターミナルで音声入力を使いたい場合も、入力欄にフォーカスが当たっているか確認しましょう。
PowerShell、Command Prompt、Cursor内蔵ターミナルなどで使う場合は、マイク権限だけでなく、現在アクティブな入力欄がどこかも意識する必要があります。
マイク環境を整えると認識精度が安定する
音声入力の精度は、使うツールだけでなくマイク環境にも大きく左右されます。
PC内蔵マイクでも使えますが、周囲のノイズ、キーボード音、エアコンの風音を拾いやすいことがあります。
安定して使うなら、単一指向性のUSBマイクやヘッドセットを使うのがおすすめです。
単一指向性マイクは、正面の声を拾いやすく、周囲の音を抑えやすい特徴があります。
また、マイク感度も重要です。
声を出したときに音量メーターが70〜80%程度で動くくらいが扱いやすいです。
感度が高すぎると音割れが起き、低すぎると認識漏れが増えます。
特にWhisper系の音声認識ツールを使う場合、音が割れていると精度が落ちやすくなります。
認識が不安定な場合は、ソフトウェアの設定を疑う前に、まずマイクの入力音量を見直したほうがよいです。
また、周囲に人がいる環境や、声を出しにくい場所では音声入力そのものが使いにくいこともあります。
音声入力は便利ですが、静かな作業環境を用意できるかどうかでも使いやすさが変わります。
Cursor標準機能とOS標準音声入力を組み合わせる
Cursorで音声入力を使う最も簡単な方法は、Cursorの標準AI機能とOS標準の音声入力を組み合わせることです。
よく使うショートカットは次の通りです。
| 操作 | Windows | Mac | 使い方 |
|---|---|---|---|
| インライン編集 | Ctrl + K |
Cmd + K |
選択したコードに対して修正指示を出す |
| AIチャット | Ctrl + L |
Cmd + L |
設計相談やエラー解説を依頼する |
| 音声入力 | Windows + H |
fnキー2回など |
プロンプトを声で入力する |
| ターミナル表示 | Ctrl + ` |
Ctrl + ` |
コマンドやログ確認に使う |
たとえば、コードの一部を選択してCtrl + KまたはCmd + Kを押します。
そのまま音声入力で、
この処理をmapを使った書き方に変えて
と話します。
入力された文章を確認し、Enterで送信すれば、Cursorが修正案を提示してくれます。
この流れを覚えておくだけでも、かなり使いやすくなります。
最初から専用ツールを入れる必要はありません。
まずはOS標準の音声入力で試して、「認識精度が足りない」「ショートカットが使いにくい」「長い指示で誤変換が多い」と感じたら、外部ツールを検討する流れが現実的です。
VSCode拡張機能をCursorで使う選択肢もある
CursorはVSCodeをベースにしているため、多くのVSCode拡張機能を利用できます。
音声入力系の拡張機能を入れることで、OS標準の音声入力よりも柔軟に操作できる場合があります。
ただし、最初から拡張機能を大量に入れる必要はありません。
まずはOS標準の音声入力で、Cursorのチャット欄やインライン編集欄に日本語を入力できるか試すのがおすすめです。
そのうえで、次のような不満が出てきたら、SuperWhisperや拡張機能の導入を検討するとスムーズです。
-
日本語の認識精度が低い
-
技術用語がうまく変換されない
-
ショートカットが使いにくい
-
長いプロンプトで誤変換が増える
最初から完璧な環境を作ろうとするより、まず使って、足りない部分だけ足すほうが失敗しにくいです。
毎日長いプロンプトを話して入力するなら専用ツールを試す価値がありますが、たまに使う程度なら標準機能からでも十分です。
日本語の認識精度を上げるSuperWhisper・Claude連携設定
SuperWhisperを使うと日本語入力が安定しやすい
MacでCursorの音声入力環境を整えるなら、SuperWhisperはかなり有力な選択肢です。
SuperWhisperはWhisper系の音声認識をローカル環境で使えるツールで、日本語の文字起こし精度を高めやすいのが特徴です。
また、CursorやNotionなど、文字を入力できる場所に音声入力を流し込める点も使いやすいところです。
Cursorのチャットだけでなく、メモやドキュメント作成にも使いたい場合は、OS標準入力より柔軟に感じることがあります。
特に開発作業では、日本語の文の中に英単語や技術用語が混ざります。
たとえば、次のような文章です。
Reactのコンポーネントを分割して、propsの型をTypeScriptで定義して。
このような文章は、一般的な音声入力だと一部がカタカナになったり、意図しない日本語に変換されたりすることがあります。
SuperWhisperのようなツールを使い、言語やモデルを調整すると、より安定した入力が期待できます。
ただし、必ず使わなければいけないわけではありません。
まずはOS標準の音声入力で試し、不満が出たら専用ツールを試すくらいの順番で問題ありません。
日本語を明示的に指定する
音声入力ツールでは、言語設定を自動検出にしていると、話し始めの英語やカタカナ語に引っ張られて誤認識することがあります。
たとえば、
CursorでReactのコードを
と話し始めたとき、英語混じりの文章として認識され、日本語部分が不自然になることがあります。
これを防ぐために、言語設定は自動検出ではなく、日本語に固定するのがおすすめです。
日本語に固定することで、次のような言葉が安定して認識されやすくなります。
-
リファクタリング
-
非同期処理
-
例外処理
-
コンポーネント
-
戻り値
-
型定義
音声入力で日本語プロンプトを使うなら、まず言語設定を確認しておきましょう。
日本語に固定しても英単語が必ず正しく入るわけではありませんが、少なくとも日本語部分の崩れは減らしやすくなります。
技術用語をカスタムプロンプトに入れる
SuperWhisperのようなツールでカスタムプロンプトや辞書登録のような機能が使える場合は、普段よく使う技術用語を登録しておくと便利です。
たとえば、以下のような単語を入れておくと、開発中の音声入力が使いやすくなります。
Cursor, Claude, TypeScript, React, Next.js, API, GitHub, リファクタリング, 非同期処理, 例外処理, コンポーネント, useState, useEffect
こうした単語をあらかじめ認識しやすくしておくことで、「React」が別の単語に変換されたり、「API」が不自然な日本語になったりする可能性を減らせます。
また、プロジェクト固有の関数名やコンポーネント名がある場合は、それらも追加しておくと役立ちます。
たとえば、UserProfileCardやfetchUserDataのような名前をよく使うなら、音声入力ツール側に覚えさせておくと、指示が通りやすくなります。
ただし、登録したからといって毎回完全に正しく変換されるとは限りません。
変数名や関数名のように正確さが必要な部分は、送信前に目で確認するのが安全です。
CursorのRules for AIに音声入力前提の指示を入れる
Cursorでは、AIに対するルールを設定できます。
ここに、音声入力で指示を出すことを前提にしたルールを入れておくと、口語表現や誤変換に強くなります。
たとえば、次のような内容です。
ユーザーは音声入力で指示を出すことがあります。
「〜して」「〜を書き換えて」といった口語表現や、多少の誤字脱字・文字起こしミスがあっても、
前後のコード文脈から本来のプログラミング意図を推測し、適切にコードを生成・修正してください。
技術用語は必要に応じて、適切な英単語、キャメルケース、スネークケース、関数名、変数名として解釈してください。
文体の細かな修正を求める必要はありません。
この設定を入れておくと、音声入力で少し崩れた文章が入っても、AIが意図をくみ取りやすくなります。
たとえば、
このマップ処理を、配列のメソッドのmapで書き換えて
と話した場合でも、AIがmapメソッドとして解釈しやすくなります。
CursorのRulesは、プロジェクトやユーザー単位で継続的な指示として使えるため、音声入力をよく使うなら一度入れておく価値があります。
音声入力を使うなら、Cursor側にも音声入力前提のルールを入れておくのがおすすめです。
サンプリング周波数とマイク感度を見直す
音声認識の精度を上げるには、オーディオ設定も見直したほうがよいです。
Macでは「Audio MIDI設定」、Windowsでは「サウンドコントロールパネル」から、マイクの入力形式を確認できます。
一般的には、16,000Hzまたは44,100Hzあたりに設定すると安定しやすいです。
Whisper系の音声認識は16kHzを前提に扱われることが多いため、入力音声が極端に特殊な設定になっていると、処理が不安定になることがあります。
また、マイク感度が高すぎると音が割れます。
音割れした音声は、人間にはなんとなく聞き取れても、AIには認識しづらくなることがあります。
逆に感度が低すぎると、語尾が落ちたり、短い単語が抜けたりします。
声を出したときに入力レベルが70〜80%程度で動くように調整すると、実用上かなり安定しやすいです。
音声入力がうまくいかないときは、ツール選びの前に、マイク音量、周囲のノイズ、入力デバイスの選択を見直してみてください。
技術用語はあえてカタカナで話すと通りやすいことがある
音声入力では、英語をネイティブ風に発音するより、カタカナに寄せてはっきり話したほうが認識されやすいことがあります。
たとえば、「GitHub」を英語っぽく発音するより、「ギットハブ」と話したほうが日本語音声入力では安定する場合があります。
「React」も「リアクト」、「Next.js」も「ネクストジェイエス」と発音したほうが、変な変換になりにくいことがあります。
ただし、コード上では英語表記が必要です。
そのため、指示としては次のように話すと通りやすいです。
リアクトのコンポーネントを作って。コード上ではReactと表記して。
マップという配列メソッドを使って。コードではmapと書いて。
このように、話しやすい日本語発音と、コードで必要な英語表記をセットで伝えると、CursorのAIが正しく解釈しやすくなります。
短く「map」とだけ言うより、「mapという配列メソッドを使って」と説明したほうが、意図が伝わりやすい場面があります。
音声入力は短く言うほど便利に見えますが、実際には少し丁寧に説明したほうが、あとから直す手間を減らせます。
助詞を省略しないとAIが理解しやすい
音声入力で短く言おうとして、
この関数、引数、追加
のように単語だけ並べると、AIが意図を取り違えることがあります。
より正確に伝えるなら、助詞を省略せずに話したほうがよいです。
たとえば、次のような言い方です。
この関数に、新しい引数を追加して。
このコンポーネントで、propsからtitleを受け取るようにして。
このAPI呼び出しの後に、エラー処理を追加して。
このように「に」「を」「で」「から」を入れるだけで、AIが処理対象と操作内容を理解しやすくなります。
音声入力では、短く話すよりも、少し丁寧に話すほうが結果的に修正回数を減らせます。
特に初心者のうちは、速く話すことよりも、何を、どこに、どうしてほしいかを入れて話すことを意識したほうが使いやすいです。
Cursorの開発ワークフローに音声入力を組み込む実践方法
インライン編集でコード修正を声で指示する
Cursorで音声入力を活かしやすいのは、インライン編集です。
コードの一部を選択してCtrl + KまたはCmd + Kを押すと、その選択範囲に対してAIへ修正指示を出せます。
たとえば、コードを選択して次のように話します。
このループ処理をmapを使った書き方に変更して。変数名も読みやすくして、必要なら型注釈も追加して。
この指示をキーボードで入力するのは少し手間ですが、音声ならすぐに伝えられます。
AIが修正案を出したら、差分を確認し、問題なければ確定します。
Cursorでは、AIが出した修正をそのまま受け入れるだけでなく、差分を見て判断できます。
音声入力で一気に指示を出し、確認は目視で行う。
この流れがかなり効率的です。
AIチャットで設計やエラー内容を相談する
Ctrl + LまたはCmd + Lで開くAIチャットも、音声入力と相性が良いです。
設計方針を相談するとき、キーボードで長文を打つのは面倒です。
音声なら、頭の中の状況をそのまま説明できます。
たとえば、次のような相談ができます。
今、ユーザー一覧画面を作っています。検索条件とページネーションをURLクエリに同期したいです。ReactとNext.jsで実装する場合、状態管理はどこに置くのがよいですか。
このような相談は、箇条書きで整理してから入力するより、まず声に出してAIに投げるほうが速いことがあります。
AIの回答を見てから、必要な部分だけ手動で整えれば十分です。
エラー解決でも、ターミナルに出たエラーをコピーしてチャットに貼り付けたうえで、音声で次のように質問できます。
このエラーの原因を説明して。どのファイルをどう直せばよいか、順番に教えて。
音声入力は、エラーの内容そのものを正確に読み上げるより、貼り付けたログに対して「何を知りたいか」を補足する使い方が向いています。
新規コード生成は音声入力と相性が良い
ゼロから関数やコンポーネントを作る場合、音声入力は特に便利です。
たとえば、TypeScriptでAPI取得関数を作るなら、次のように話します。
TypeScriptで、引数にユーザーIDを受け取って、データベースからプロフィール情報を取得する非同期関数を作って。成功した場合はプロフィール情報を返して、失敗した場合はtry-catchでエラーを処理して。戻り値の型も定義して。
この指示には、言語、引数、処理内容、エラー処理、戻り値の型という複数の条件が入っています。
キーボードで書くと時間がかかりますが、声なら自然に伝えられます。
新規コード生成では、まず音声で大枠を伝えてAIに生成させ、その後に確認しながら修正するほうが効率的です。
ただし、生成されたコードをそのまま採用するのではなく、型、エラー処理、セキュリティ、既存コードとの整合性は必ず確認しましょう。
リファクタリング指示を定型フレーズ化する
音声入力を安定して使うには、よく使う指示を定型フレーズ化しておくと便利です。
たとえば、リファクタリングでは次のようなフレーズをよく使います。
このコードを、可読性が高くなるようにリファクタリングして。
ネストが深いので、早期リターンを使って読みやすくして。
同じ処理が重複しているので、共通関数に切り出して。
変数名を意味が伝わりやすい名前に変更して。
パフォーマンスに影響しそうな処理があれば指摘して。
こうした言い方を自分の中で決めておくと、毎回プロンプトを考える負担が減ります。
音声入力は自由に話せる反面、話が長くなりすぎることがあります。
定型フレーズを持っておくと、短くても意図が伝わりやすくなります。
特にリファクタリングは、複数の条件をまとめて伝えやすく、Cursor側も選択したコードの文脈を見ながら修正しやすい作業です。
テストコード作成も音声入力で依頼しやすい
テストコードの生成も、Cursorと音声入力の組み合わせが役立つ場面です。
たとえば、関数を選択して次のように話します。
この関数に対するJestのユニットテストを作って。正常系を3パターン、異常系を3パターン用意して。モックが必要な外部API呼び出しは適切にモック化して。
このような指示は条件が多く、手で入力すると少し面倒です。
音声なら、必要な条件をまとめて伝えやすくなります。
テストコードは抜け漏れが起きやすいので、次の言葉を入れるとAIが出力しやすくなります。
-
正常系
-
異常系
-
境界値
-
モック
-
期待値
テスト作成こそ、音声入力でまとめて依頼するとラクになります。
ただし、AIが作ったテストは、期待値や前提条件が実装とずれていないか確認する必要があります。
コメントやドキュメント作成にも使える
Cursorの音声入力は、コード生成だけでなくコメントやドキュメント作成にも使えます。
たとえば、複雑な関数にコメントを入れたい場合は、次のように話します。
この処理が何をしているのか、各ステップごとにコメントを追加して。専門用語を使いすぎず、あとから読んでも理解しやすい説明にして。
READMEや仕様メモを書く場合も、音声入力は便利です。
この機能の使い方をREADMEにまとめて。インストール手順、環境変数の設定、起動方法、よくあるエラーの対処法を見出し付きで整理して。
ドキュメント作成は長い文章になりやすいです。
だからこそ、キーボード入力より音声入力のほうが負担を減らせます。
コードを書く作業だけでなく、仕様整理や説明文の下書きにも使えるので、Cursorを文章作成の補助としても活用できます。
ターミナル操作やデバッグでも音声入力を活かせる
Cursorの内蔵ターミナルを使っている場合、音声入力はデバッグ作業にも使えます。
ただし、ターミナルに直接コマンドを音声入力する場合は注意が必要です。
誤変換されたコマンドをそのまま実行すると、意図しない操作になる可能性があります。
僕も、ターミナルに直接コマンドを音声入力するのは少し怖いと感じました。
コマンドは一文字違うだけでも意味が変わることがあるため、誤変換されたまま実行するのは避けたほうが安全です。
そのため、ターミナルでは直接実行するより、まずCursorのチャットに相談する使い方が安全です。
たとえば、エラーログをコピーしてチャットに貼り付け、音声で次のように話します。
今貼り付けたエラーの原因を教えて。修正するファイルと、確認すべき設定を順番に説明して。
また、ビルドエラーが出たときは次のように聞けます。
このビルドエラーを解決したいです。依存関係の問題なのか、TypeScriptの型エラーなのか、原因を切り分ける手順を教えて。
コマンド実行は手入力やコピペで確認し、音声入力は「このエラーの原因を教えて」と相談する使い方に寄せると安心です。
音声入力と手動編集は役割を分ける
すべてを音声だけで操作しようとすると、逆に効率が落ちることがあります。
音声入力には、得意な作業と不得意な作業があります。
音声入力が向いているのは、次のような作業です。
| 音声入力が向いている作業 | 理由 |
|---|---|
| 長いプロンプトの入力 | 話すほうが速い |
| 新規コード生成 | 条件をまとめて伝えやすい |
| リファクタリング指示 | 意図を自然文で説明しやすい |
| エラー内容の相談 | 状況を口頭で補足しやすい |
| ドキュメント作成 | 長文の下書きに向いている |
一方で、次のような作業はキーボードやマウスのほうが向いています。
| 手動操作が向いている作業 | 理由 |
|---|---|
| 1文字だけの修正 | キーボードのほうが速い |
| 変数名の細かい調整 | 誤認識を避けやすい |
| インデント調整 | 手動のほうが確実 |
| 複数ファイルの移動 | ショートカット操作が速い |
| 危険なコマンド実行 | 誤変換リスクを避けられる |
音声入力は、キーボードを完全に置き換えるものではありません。
長い指示は音声、細かい修正は手動。
この分担が一番使いやすいです。
話すほうが速い人もいれば、タイピングしながら考えを整理するほうが合う人もいます。
自分に合うかどうかは、まず長めのプロンプトを数回だけ音声入力してみると判断しやすいです。
不要語は無理に直さずAIに投げる
音声入力を使っていると、「あー」「えっと」「その」「さっきの」などが混ざることがあります。
普通なら削除したくなりますが、Cursorにプロンプトとして渡すだけなら、毎回きれいに整える必要はありません。
たとえば、次のような入力でも十分です。
えっと、この下のフォームのところで、入力値が空だったら送信できないようにして、エラーメッセージを表示するようにして。
AIは文脈を見て、フォームバリデーションを追加する指示だと理解できます。
ここで不要語を一文字ずつ削るより、そのまま送信して結果を確認したほうが速いです。
もちろん、誤認識によって意味が変わっている場合は修正が必要です。
しかし、単なる口癖や言い淀みであれば、気にしすぎないほうが作業は進みます。
音声入力では、「文章をきれいにすること」よりも「Cursorに意図が伝わること」を優先すると使いやすくなります。
実務で使いやすい音声プロンプト例
Cursorで音声入力を使うときは、次のようなプロンプトを用意しておくと便利です。
コード生成
TypeScriptで、指定したIDのユーザー情報を取得する非同期関数を作って。API呼び出しに失敗した場合はエラーを返して、戻り値の型も定義して。
リファクタリング
このコードを読みやすくリファクタリングして。ネストを浅くして、重複している処理があれば共通関数に切り出して。
バグ修正
この処理でエラーが起きる原因を探して。nullやundefinedの可能性がある箇所を確認して、安全に動くように修正して。
テスト作成
この関数に対するJestのテストを書いて。正常系、異常系、境界値のテストケースをそれぞれ作って。
コメント追加
この処理が何をしているのか、あとから読んでも分かるようにコメントを追加して。
エラー解説
このエラーの意味を説明して。原因として考えられることと、修正手順を順番に教えて。
README作成
この機能の使い方をREADME形式でまとめて。概要、セットアップ方法、使い方、注意点の順番で書いて。
こうしたプロンプトを声で出せるようにしておくと、Cursorを使った作業がかなりスムーズになります。
慣れないうちは、すべてをその場で考えるより、よく使う言い回しをいくつか持っておくと迷いにくいです。
会議メモや仕様整理にも応用できる
Cursorはコードを書くためのエディタですが、Markdownファイルを作って音声入力すれば、会議メモや仕様整理にも使えます。
たとえば、meeting-note.mdを作成し、打ち合わせ内容を音声入力でざっと入れます。
文章が多少乱れていても構いません。
その後、ファイル全体を選択してCursorに次のように指示します。
このメモを、決定事項、未決事項、次にやること、担当者の4つに分けてMarkdownで整理して。
この使い方は、仕様変更が多い開発現場で特に便利です。
会話で決まった内容をそのままテキスト化し、Cursorで整理すれば、ドキュメント作成の負担を減らせます。
ただし、業務上の機密情報や個人情報が含まれるメモを扱う場合は、音声入力ツールやCursor側のデータ処理設定を確認してから使いましょう。
トラブルが起きたときの確認ポイント
音声入力がうまく動かない場合は、順番に原因を切り分けます。
まず確認するのはマイク権限です。
Macなら「プライバシーとセキュリティ」から、マイク、アクセシビリティ、必要に応じて画面収録の権限を見ます。
Windowsなら「プライバシーとセキュリティ」のマイク設定を確認します。
次に、入力先にカーソルがあるか確認します。
音声入力を起動しても、Cursorのチャット欄や編集欄にフォーカスが当たっていないと、別の場所に入力されたり、何も起きなかったりします。
さらに、既定のマイクが正しいかも確認しましょう。
Discord、外部オーディオデバイス、仮想マイクなどが既定になっていると、声が拾われないことがあります。
日本語の変換が不安定な場合は、言語設定を日本語に固定し、技術用語の登録や発話方法を見直します。
「map」を「マップ」と認識してほしい場面もあれば、コード上ではmapとして扱ってほしい場面もあります。
その場合は、
コードではmapと書いて
と補足すると通りやすくなります。
短い単語だけで伝えようとして失敗する場合は、少し長くなっても「何をどうしたいか」まで話すほうが安定します。
セキュリティとプライバシーも確認しておく
音声入力を開発作業に使う場合、音声データやプロンプトがどこで処理されるのかは確認しておくべきです。
ローカル処理型の音声認識ツールを使う場合、音声のテキスト化がPC内で完結するため、音声そのものを外部に送らずに済む可能性があります。
一方、クラウド型の音声入力では、音声データが外部サーバーで処理される場合があります。
Windows標準の音声入力も、Windows 11ではオンライン音声認識を使う仕組みです。
そのため、「OS標準だから必ずローカルで安全」と考えず、業務利用ではデータの扱いを確認しておきましょう。
また、Cursorに送信するプロンプトには、コードや仕様情報が含まれることがあります。
業務で使う場合は、Cursorのプライバシー設定を確認し、必要に応じてPrivacy Modeをオンにするなど、社内ルールに合わせた運用が必要です。
CursorのPrivacy Modeを有効にすると、Customer DataがCursorの学習に使われない設定にできます。
ただし、プライバシー関連の仕様は変更される可能性があるため、業務で使う前には最新の設定画面や公式情報を確認してください。
特に、次のような情報は慎重に扱いましょう。
-
機密性の高いコード
-
顧客情報
-
APIキー
-
認証情報
-
社外秘の仕様
-
個人情報
音声入力は便利です。
ただし、便利さだけでなく、情報管理もセットで考える必要があります。
まとめ
Cursorで音声入力を使う最大のメリットは、AIへの指示をキーボードで長々と打たなくてよくなることです。
コードを書く作業がAIとの対話に近づくほど、プロンプトをすばやく作る力が重要になります。
WindowsならWindows + H、Macなら標準音声入力やSuperWhisperを使うことで、Cursorのチャットやインライン編集に日本語で指示を入力できます。
最初から専用ツールを入れなくても、短い日本語プロンプトならOS標準の音声入力から試せます。
ただし、TypeScript、React、mapのような技術用語が混ざる場合は、カタカナで話したり、「コードではmapと書いて」と補足したりすると伝わりやすくなります。
さらに、Rules for AIに音声入力前提のルールを入れたり、技術用語を登録したり、マイク環境を整えたりすることで、認識精度はより安定します。
ただし、大切なのは、すべてを音声で完結させようとしないことです。
長い指示や設計相談は音声、細かい修正はキーボード。
このように役割を分けると、Cursorの使い勝手は大きく向上します。
特にターミナル操作や機密情報を含む作業では、誤変換やデータの扱いにも注意が必要です。
まずは、Cursorのチャット欄やインライン編集欄で、短い日本語プロンプトを音声入力してみるのがおすすめです。
よくある質問
Q1. Cursorで音声入力は使えますか?
はい、使えます。
Cursor自体に入力欄があるため、OS標準の音声入力やSuperWhisperなどの外部ツールを使えば、チャット欄やインライン編集欄に音声でプロンプトを入力できます。
WindowsならWindows + H、Macなら標準の音声入力ショートカットを使う方法が手軽です。
まずは標準音声入力で試し、認識精度やショートカットに不満が出たら専用ツールを検討するとよいです。
Q2. 日本語でコード生成の指示を出しても大丈夫ですか?
日本語で問題ありません。
CursorのAIは日本語の自然文を理解できるため、
この関数にエラー処理を追加して
このコンポーネントを分割して
といった指示でも対応できます。
ただし、関数名や変数名、メソッド名などは、必要に応じて「コードではmapと書いて」のように補足すると認識が安定します。
英語の技術用語がうまく入らない場合は、カタカナで話したうえで、コード上の表記を補足するのがおすすめです。
Q3. SuperWhisperは必ず必要ですか?
必須ではありません。
まずはWindowsやMacの標準音声入力だけでも試せます。
ただし、日本語の認識精度、技術用語の扱いやすさ、ローカル処理へのこだわりがある場合は、SuperWhisperのような専用ツールを使う価値があります。
特に長いプロンプトを頻繁に入力するなら、専用ツールのほうが快適になりやすいです。
毎日使うなら専用ツール、たまに使うだけなら標準機能から試す、という分け方が現実的です。
Q4. 音声入力の誤変換が多いときはどうすればいいですか?
まず、マイクの入力音量、周囲のノイズ、言語設定を確認しましょう。
言語は自動検出ではなく、日本語に固定すると安定しやすいです。
また、技術用語はカスタムプロンプトや辞書に登録し、英語の発音が認識されにくい場合はカタカナ寄りにはっきり話すと改善することがあります。
さらに、Cursor側のRules for AIに、音声入力の誤変換を文脈から補正するよう指示しておくのも有効です。
それでも変数名や関数名が大きく崩れる場合は、送信前にその部分だけ手で直したほうが安全です。
Q5. 音声入力だけで開発作業を完結できますか?
完全に音声だけで進めるより、キーボードやマウスと組み合わせたほうが現実的です。
音声入力に向いているのは、長いプロンプト、設計相談、エラー解説、リファクタリング指示、ドキュメント作成などです。
一方で、1文字だけの修正、細かい変数名変更、インデント調整、危険なコマンド実行は手動操作のほうが安全で速いです。
音声入力と手動編集を分担することで、Cursorをより効率よく使えます。