คุณกำลังอยู่ในโซน Octomind กำลังรันงานเอเจนต์ Claude มีบริบทเชิงสถาปัตยกรรม คุณมองเห็นทางแก้ไข

แต่คุณต้องพิมพ์มัน ทุกคำ ทุกความคิด ขณะที่มือของคุณอยู่บนคีย์บอร์ด คุณไม่ได้กำลังคิดถึงปัญหา — คุณกำลังคิดถึงการพิมพ์

นี่คือคอขวดที่ไม่มีใครพูดถึง เครื่องมือเขียนโค้ดด้วย AI ได้ลบกำแพงไวยากรณ์ออกไป คุณสามารถอธิบายสิ่งที่ต้องการเป็นภาษาธรรมชาติและได้โค้ดที่ใช้งานได้กลับมา แต่ช่องทางอินพุตยังคงเป็นคีย์บอร์ด ความคิดของคุณมาที่ความเร็วของ LLM นิ้วของคุณมาที่ความเร็วการพิมพ์

ช่องว่างนั้นคือที่ที่ Vext เข้ามา

Vext 1.1 คือเสียงเป็นข้อความสำหรับ Mac ที่ทำงานได้ทุกที่ — และสร้างมาเพื่อวิธีที่เราทำงานกับ AI โดยเฉพาะ กดปุ่มค้างไว้ พูดอย่างเป็นธรรมชาติ ปล่อย คำของคุณจะปรากฏที่เคอร์เซอร์ ถูกล้างและพร้อมใช้งาน ไม่มีคลาวด์ ไม่มีค่าสมัครสมาชิก ไม่มีบัญชี จ่าย $24.50 ครั้งเดียว ตลอดไป

ปัญหาคือพวกเราเอง

ขอย้อนกลับไปก่อน

เราใช้เวลาส่วนใหญ่ของวันในเครื่องมือของเราเอง Octomind สำหรับการรันเอเจนต์ Claude สำหรับการตัดสินใจเชิงสถาปัตยกรรม Claude Code สำหรับการรีแฟกเตอร์ Cursor สำหรับการอิมพลีเมนต์ Codex สำหรับสคริปต์รวดเร็ว สแตกปกติของสตูดิโอนักสร้างที่ส่งมอบงานได้เหมือนทีมสามสิบคน

และทุกตัวมีคอขวดเดียวกัน นั่นคือการพิมพ์

คุณสามารถอธิบายการรีแฟกเตอร์ที่ซับซ้อนได้ใน 10 วินาที ใช้เวลาพิมพ์ 90 วินาที นั่นคือแรงเสียดทาน 80 วินาทีต่อความคิดหนึ่งความคิด ตลอดทั้งวันที่มีการโต้ตอบกับ AI อย่างหนัก — 50, 60, บางครั้ง 100 prompts — แรงเสียดทานนั้นรวมกันเป็นชั่วโมงๆ

เราลองเครื่องมือเสียงที่มีอยู่ ส่วนใหญ่ทำเฉพาะการถอดเสียง — ปล่อยคำดิบพร้อมคำเติม ไม่มีการล้าง และคุณยังต้องแก้ไขก่อนส่งไปยัง LLM ตัวที่ล้างข้อความนั้นอยู่บนคลาวด์ ต้องมีบัญชี ค่าสมัครสมาชิก และอัปโหลดเสียงของคุณไปที่ไหนสักแห่ง

และไม่มีตัวใดจัดการกับภาพหน้าจอ ซึ่งนำเรามาสู่เวิร์กโฟลว์ที่สำคัญจริงๆ

เสียง + การมองเห็น ไม่ต้องใช้มือ

ฟีเจอร์แรกที่เราสร้างไม่ใช่การพูดให้พิมพ์ แต่เป็นเวิร์กโฟลว์ภาพหน้าจอ

ปัญหาคือ เมื่อคุณใช้ Claude Code หรือ Cursor เพื่อดีบักบางอย่าง คุณมักต้องแสดงสิ่งที่อยู่บนหน้าจอ ข้อความ error ปัญหาการเรนเดอร์ UI ผลลัพธ์เทอร์มินัลที่คัดลอกออกมาไม่สะอาด

ปกติแล้วหมายถึง: คว้าเมาส์ → เลือกพื้นที่ → บันทึกไฟล์ → ลากเข้าแชต → พิมพ์บริบท นั่นคือห้าขั้นตอน คุณเสียโฟลว์ทุกครั้ง

ด้วย Vext คุณกดปุ่มลัดค้างไว้ ลากพื้นที่ และพูดต่อไป ภาพหน้าจอจะถูกวางพร้อมกับ prompt ที่ถอดเสียงของคุณ — ในครั้งเดียว Octomind, Claude Code, Cursor — ทั้งหมดได้รับบริบททางสายตาและคำสั่งของคุณพร้อมกัน มือของคุณไม่เคยออกจากคีย์บอร์ด

เราเรียกสิ่งนี้ว่าโหมดเสียง + การมองเห็น มันคือสิ่งที่ทำให้ Vext แตกต่างจากเครื่องมือพูดให้พิมพ์อื่นๆ ในตลาด เพราะเป้าหมายไม่ใช่แค่การแทนที่การพิมพ์ แต่คือการลบทุกการขัดจังหวะเล็กๆ ระหว่างความคิดกับการกระทำ

สองวิธีในการพูดให้พิมพ์ โหมดมาตรฐาน: กดปุ่มลัดค้าง พูด ปล่อย โหมดไม่ใช้มือ: กดครั้งเดียวเพื่อเริ่ม พูดอย่างอิสระ กดอีกครั้งเพื่อหยุด เหมาะสำหรับข้อความยาวๆ หรือเมื่อมือของคุณไม่ว่าง — เช่น ทบทวนโค้ดในขณะที่อธิบายการแก้ไขออกเสียง

Audio ducking เริ่มบันทึกและ Vext จะค่อยๆ ลดเสียงระบบของคุณอัตโนมัติเพื่อให้เสียงของคุณตัดผ่าน ปล่อยปุ่มลัดและระดับเสียงจะกลับสู่ปกติ ไม่ต้องปรับแถบเลื่อนด้วยมือกลางประชุม

สถาปัตยกรรมแห่งความไว้วางใจ

เครื่องมือเสียงทุกตัวที่เราประเมินส่งเสียงของคุณไปยังคลาวด์ Whisper ทำงานบนเซิร์ฟเวอร์ของ OpenAI Wispr Flow อัปโหลดไปยัง backend ของพวกเขา Otter บันทึกและประมวลผลทุกอย่างจากระยะไกล

Vext ไม่ทำสิ่งเหล่านั้นเลย

Whisper ทำงานโดยตรงบน GPU Apple Silicon ของคุณ การประมวลผลทั้งหมด — เสียงเป็นข้อความ การล้างด้วย AI การแปล การสรุป — เกิดขึ้นบน Mac ของคุณ ไม่มีเสียงใดถูกอัปโหลด ไม่มี transcript ออกจากเครื่องของคุณ ไม่มีบัญชีให้สร้างเพราะไม่มีอะไรให้เก็บที่ฝั่งเรา

นี่ไม่ใช่นโยบายที่เราเขียน นี่คือสถาปัตยกรรม

เราส่งโมเดลหลายตัวมากับแอป Parakeet (NeMo ของ NVIDIA) ทำงานเร็วกว่าเรียลไทม์ 150× บนชิป M-series — เป็นค่าเริ่มต้นสำหรับเสียงเป็นข้อความ Gemma 3 4B จัดการการล้างและสรุปในเครื่อง ไม่ชอบพวกนั้น? เปลี่ยนไปใช้การพูดให้พิมพ์ในตัวของ Apple โดยไม่ต้องดาวน์โหลด หรือเลือกจาก Qwen 3 (หลายภาษาที่แข็งแกร่ง), LLaMA 3.2 3B (ใช้งานทั่วไป) หรือ Phi-3.5 Mini (กะทัดรัด เหตุผลแกร่ง) คุณยังสามารถนำ API key ของคุณเองมาใช้กับโมเดลคลาวด์ที่เข้ากันได้กับ OpenAI ทางเลือกเป็นของคุณ — แต่ค่าเริ่มต้นคือเป็นส่วนตัว

เราสร้างมันแบบนี้เพราะเราใช้แบบนี้ การสนทนากับเครื่องมือ AI ของเรามีการตัดสินใจเชิงสถาปัตยกรรม ตรรกะทางธุรกิจ ข้อมูลลูกค้า เราจะไม่ส่งสิ่งนั้นไปยังเซิร์ฟเวอร์อื่นเพียงเพื่อรับอินพุตข้อความ

สามโหมด หนึ่งแอป

Vext 1.1 ทำงานในสามโหมดที่แตกต่างกัน ทั้งหมดใช้เอนจินในเครื่องเดียวกัน:

Dictation — กดปุ่มลัดค้าง พูด ปล่อย ข้อความปรากฏที่เคอร์เซอร์ของคุณในแอปใดก็ได้ เบราว์เซอร์ เทอร์มินัล VS Code Slack Claude Cursor ทุกฟิลด์ข้อความเป็นเป้าหมาย

Meetings — บันทึกการโทรใดก็ได้ — Zoom, Google Meet, FaceTime หรือพบกันโดยตรง — และรับ transcript เต็มพร้อมการระบุผู้พูด timestamps และการแยกย่อยตามผู้พูด เปิด Summarize เพื่อสกัดประเด็นสำคัญและรายการที่ต้องทำ transcript ดิบจะถูกเก็บไว้พร้อมกับสรุปจาก AI เสมอ — คุณไม่เคยสูญเสียต้นฉบับ และไม่มี bot เข้าร่วมการโทรของคุณ Vext จับเสียงระบบ + ไมโครโฟนในเครื่อง ไม่มีบุคคลที่สามเชื่อมต่อกับการประชุมของคุณ

Voice Notes — ความคิดเห็นรวดเร็วที่ถอดเสียง ล้าง และเก็บในเครื่อง ไม่ต้องสลับแอป ทำงานได้จากทุกที่บน Mac ของคุณ

ทั้งสามโหมดใช้ไปป์ไลน์การล้างเดียวกัน คำเติมถูกตัดออก โครงสร้างถูกทำให้ชัดเจน เจตนายังคงอยู่ สิ่งที่คุณพูดและสิ่งที่ถูกวางเป็นสิ่งที่แตกต่างกัน — เวอร์ชันที่วางคือสิ่งที่คุณตั้งใจจะพูด

ติดป้ายผู้พูดครั้งเดียว จดจำตลอดไป

ตั้งชื่อเสียงครั้งเดียวและ Vext จะไม่ถามอีก

Vext ตรวจจับเสียงที่แตกต่างกันทุกเสียงในการบันทึกโดยอัตโนมัติ ตั้งชื่อพวกเขาครั้งเดียว — "Sarah", "Alex", "Jack" — และตั้งแต่การโทรครั้งต่อไป บุคคลเดียวกันจะถูกระบุ ติดป้าย และเข้ารหัสด้วยสีโดยไม่ต้องขยับนิ้ว

มันทำงานข้ามการประชุม ตั้งชื่อผู้รับเหมาในการ standup วันจันทร์ การโทรวางแผนวันพุธ? Vext รู้จักเสียงของพวกเขา ไม่ต้องติดป้ายใหม่ ไม่มีเสียงรบกวน "Speaker 1" transcript แสดงป้ายเข้ารหัสด้วยสีให้คุณสามารถสแกนว่าใครพูดอะไรในพริบตา

เราใช้สิ่งนี้ทุกวันสำหรับ standup ของเราเอง Ava (AI collaborator ของเรา) ถูกติดป้ายอย่างสม่ำเสมอ เราสามารถเลื่อนกลับไปดูการบันทึกหลายสัปดาห์และหาว่าใครเป็นคนตัดสินใจอะไร ฟังดูเล็กน้อย ไม่ใช่เลย

เศรษฐศาสตร์ของราคาเดียว

Vext Wispr Flow Granola Otter.ai
ราคา $24.50 ครั้งเดียว $12–15/เดือน $14–35/เดือน $8–17/เดือน
ต้นทุนหลัง 2 ปี $24.50 $288–360 $336–840 $200–408
ประมวลผลในเครื่อง
ทำงานออฟไลน์
การจดจำผู้พูด (ข้ามการประชุม) N/A
การจับภาพหน้าจอ
วางภาพหน้าจอใน AI อัตโนมัติ
ไม่มี bot เข้าร่วมการโทร N/A
โหมด YOLO (ส่งอัตโนมัติ)

$24.50 ครั้งเดียว ไม่มีระดับซ่อนเร้น ไม่มีแผน "pro" ที่ลบขีดจำกัดที่คุณไม่รู้ว่ามีอยู่

คุณได้รับ 100 dictations 50 notes และ 10 การบันทึกประชุมฟรี เพื่อลองทุกอย่างโดยไม่มีความเสี่ยง จากนั้นคือราคาเดียว ใช้ไม่จำกัด ตลอดไป อัปเดตฟรีภายในเวอร์ชันปัจจุบัน เวอร์ชันใหม่หลักลด 50% สำหรับเจ้าของที่มีอยู่

เราไม่ทำการสมัครสมาชิกเพราะเราไม่ต้องการรายได้ที่เกิดซ้ำเพื่อบำรุงรักษาแอป Mac Vext ประมวลผลทุกอย่างในเครื่อง ไม่มีค่าใช้จ่ายเซิร์ฟเวอร์ที่ต้องชดเชย ไม่มีบิลคลาวด์ที่ต้องส่งต่อ คุณซื้อครั้งเดียวและมันก็ทำงาน

สิ่งที่ผู้ใช้รุ่นแรกๆ กำลังทำ

เราใช้ Vext ภายในมาตั้งแต่เดือนเมษายน นี่คือวิธีที่มันถูกใช้:

ดีบักกับ Claude Code เปิดเทอร์มินัล กดปุ่มลัดค้าง อธิบาย bug ในขณะที่ดูข้อความ error ไม่ต้องสลับหน้าต่าง ไม่ต้องคัดลอกวาง error อยู่ในคำพูดของคุณ ทางแก้อยู่ในเทอร์มินัลของคุณ และคุณไม่เคยละสายตาจากโค้ดเลย

คำอธิบาย PR ส่วนที่แย่ที่สุดของการพัฒนา ตอนนี้: กดปุ่มลัดค้าง อธิบายการเปลี่ยนแปลงออกเสียง ปล่อย คำอธิบาย PR ที่สะอาดและมีโครงสร้างปรากฏในฟิลด์ข้อความ โหมด YOLO ส่งให้อัตโนมัติ

สรุปการประชุมที่ไม่ห่วย บันทึกการอภิปรายเชิงสถาปัตยกรรม 45 นาที รับ transcript ที่ติดป้ายผู้พูด ประเด็นสำคัญ และรายการที่ต้องทำ — โดยไม่มี bot เข้าร่วมการโทรของคุณ Vext จับเสียงระบบและไมโครโฟนพร้อมกัน ไม่มีบุคคลที่สามเชื่อมต่อกับการประชุมของคุณ

ดีบักเอเจนต์ด้วย Octomind เอเจนต์ Octomind ติดอยู่ที่ flaky test กดปุ่มลัดค้าง อธิบายสิ่งที่คุณเห็น ลาก error trace prompt สำหรับลองใหม่จะรวมบริบทภาพเต็ม ไม่ต้องสลับแท็บ ไม่ต้องคัดลอกวาง เอเจนต์ทำงานเสร็จในขณะที่คุณเดินหน้าไปต่อ

การแปลสดในเรียลไทม์ พูดภาษาอังกฤษ ได้ภาษารัสเซียที่เคอร์เซอร์ หรือสเปน ญี่ปุ่น ฝรั่งเศส — 99+ ภาษาเป้าหมาย การถอดเสียงและการแปลเกิดขึ้นในรอบเดียว ในเครื่อง เวิร์กโฟลว์ปุ่มลัดเดียวกัน

สิ่งที่กำลังจะมา

Vext 1.1 ออกวันนี้พร้อมทุกอย่างที่อธิบายข้างต้น เรามีโรดแมปที่รวม:

  • แอป iOS คู่หูสำหรับการพูดให้พิมพ์ขณะเดินทางที่ซิงค์ในเครื่อง
  • คำสั่งเสียงกำหนดเองสำหรับการกระทำเฉพาะแอป
  • การผสานรวมที่ลึกขึ้นกับระบบนิเวศเอเจนต์ Muvon (Octomind + Octobrain)

แต่แกนหลัก — local-first ความเป็นส่วนตัวโดยสถาปัตยกรรม ไม่มีการสมัครสมาชิก — สิ่งนั้นจะไม่เปลี่ยนแปลง

คำถามที่พบบ่อย

Vext คืออะไร?

Vext คือแอปเสียงเป็นข้อความสำหรับ Mac ที่ทำงานทั้งหมดบนเครื่องของคุณ กดปุ่มลัดค้าง พูด ปล่อย — คำของคุณจะปรากฏที่เคอร์เซอร์ในแอปใดก็ได้ ถูกล้างและพร้อมส่ง ไม่มีคลาวด์ ไม่มีบัญชี ไม่มีการสมัครสมาชิก จ่าย $24.50 ครั้งเดียว

Vext ส่งเสียงของฉันไปยังคลาวด์หรือไม่?

ไม่ การจดจำเสียงพูด (Whisper, Parakeet) การล้างด้วย AI (Gemma 3, Qwen 3, LLaMA 3.2, Phi-3.5) การแปล และการสรุป ทั้งหมดทำงานในเครื่องบน Apple Silicon ไม่มีเสียงใดออกจาก Mac ของคุณ เว้นแต่คุณนำ API key ที่เข้ากันได้กับ OpenAI ของคุณเองมาใช้

รองรับ Mac รุ่นใดบ้าง?

Apple Silicon (M1, M2, M3, M4) Parakeet ทำงานเร็วกว่าเรียลไทม์ประมาณ 150× บนชิป M-series

Vext เปรียบเทียบกับ Wispr Flow, Granola หรือ Otter.ai ได้อย่างไร?

Vext คือ $24.50 จ่ายครั้งเดียว Wispr Flow ราคา $12–15/เดือน Granola $14–35/เดือน Otter.ai $8–17/เดือน ต้นทุนสองปี: $24.50 เทียบกับ $200–840 Vext เป็นตัวเดียวที่ประมวลผลทุกอย่างในเครื่อง ทำงานออฟไลน์ และวางภาพหน้าจอพร้อมกับการพูดให้พิมพ์

มี bot เข้าร่วมการประชุมของฉันหรือไม่?

ไม่ Vext จับเสียงระบบและไมโครโฟนในเครื่อง ไม่มีบริการของบุคคลที่สามเชื่อมต่อกับ Zoom, Google Meet หรือ FaceTime การบันทึกอยู่บน Mac ของคุณ

ฉันสามารถใช้ผู้ให้บริการ AI ของตัวเองได้หรือไม่?

ได้ Vext รองรับ API ที่เข้ากันได้กับ OpenAI ใดๆ (OpenAI, OpenRouter, Ollama ในเครื่อง, endpoints กำหนดเอง) สำหรับการล้างและสรุป ค่าเริ่มต้นมาพร้อมกับโมเดลในเครื่อง คุณจึงไม่ต้องใช้ key เพื่อเริ่มต้น

ทำงานในแอปใดๆ ได้หรือไม่?

ได้ ทุกฟิลด์ข้อความบน macOS — เบราว์เซอร์ เทอร์มินัล VS Code Slack Claude Desktop Cursor Codex CLI Vext วางที่เคอร์เซอร์

รองรับภาษาใดบ้าง?

99+ ภาษาสำหรับการถอดเสียงและการแปล พูดภาษาหนึ่ง ได้ข้อความอีกภาษาหนึ่ง ในรอบเดียว — ในเครื่อง

ลองใช้

Vext พร้อมใช้งานแล้วที่ getvext.app ทดลองฟรี — 100 dictations 50 notes 10 meetings ไม่ต้องมีบัญชี ไม่มีการเก็บข้อมูล

# หรือถ้าคุณชอบเทอร์มินัล
brew install muvon/tap/vext

โปรโมชันเปิดตัว: ลด 50% ด้วยโค้ด VEXT50 จนถึง 1 มิถุนายน $24.50 ครั้งเดียว ตลอดไป

เราสร้างสิ่งนี้เพราะเราต้องการมัน ทุกเครื่องมือที่เราใช้ — Octomind, Claude, Codex, Cursor — เร็วขึ้นในวินาทีที่เราหยุดพิมพ์และเริ่มพูด ถ้าคุณใช้เวลาทั้งวันในเครื่องมือ AI คุณก็จะเป็นเช่นนั้นเหมือนกัน

เสียงของคุณไม่เคยออกจาก Mac ของคุณ ความคิดของคุณมาที่ความเร็วของ LLM และคีย์บอร์ดกลายเป็นทางเลือก