Bài 4/10Kiến thức

Bài 4, Research partner: dùng Claude để research thị trường, đối thủ, khách hàng mà không bị hallucinate

Cách dùng Claude làm research: web search có dẫn nguồn, competitor teardown, market sizing, synthesize 10 cuộc phỏng vấn khách hàng. Có pattern fact-check 3 lớp để tránh AI đưa số sai.

The Data Way11 phút đọc
Series Claude, The Data Way

Founder gửi tôi một slide pitch deck. Trang 4 có một số to: “Thị trường F&B Việt Nam 2025 đạt 35 tỷ USD”. Tôi hỏi nguồn ở đâu, anh nói: “Claude bảo thế”.

Tôi tra ngược lại. Số đúng (theo Statista + Vietnam Report) là khoảng 24-26 tỷ USD tùy năm và tùy cách tính (có gồm bán lẻ thực phẩm hay không). Claude nói 35 tỷ là sai.

Đây là rủi ro lớn nhất khi dùng AI research: AI có thể nói rất tự tin về một số bịa. Bài này dạy bạn cách research với Claude mà vẫn ra số đúng, và đặc biệt là 3 lớp fact-check để không bao giờ đưa số sai vào pitch deck.


Web search có dẫn nguồn, không còn là “Claude offline”

Từ 2025, Claude có web search built-in. Khi bạn hỏi về thông tin mới hoặc cụ thể, Claude sẽ search web, đọc, và trả lời kèm citation. Có hai chế độ:

  • Tự động: Claude tự quyết định khi nào cần search. Thường khi bạn hỏi về “mới nhất”, “hiện tại”, hoặc một sự kiện cụ thể.
  • Bắt buộc: Bạn nói rõ “search web và cite nguồn” trong prompt. Claude sẽ search và trả về danh sách link.

Khác biệt quan trọng với Claude vs ChatGPT/Gemini: Claude cite từng câu, bạn click vào link là ra đoạn web gốc đúng. Trong khi đó nhiều model khác cite ở cuối câu trả lời, không khớp với từng claim cụ thể.

Cách viết prompt research chuẩn:

Search web và trả lời câu hỏi sau, kèm citation cho từng số:

Tôi cần biết tổng quan thị trường bán lẻ điện máy Việt Nam 2024-2025:
- Quy mô thị trường (USD và VND)
- Top 5 chuỗi lớn nhất theo doanh thu
- Tăng trưởng YoY 2023→2024 và dự báo 2025
- Tỷ trọng online vs offline

Yêu cầu:
- Mỗi số liệu phải có 1 nguồn cụ thể (không nói "theo các báo cáo")
- Nếu nguồn xung đột, nói rõ "nguồn A nói X, nguồn B nói Y"
- Ưu tiên nguồn gốc: GSO, Vietnam Report, Statista, EuroMonitor, Q&Me. Tránh báo lá cải tổng hợp.
- Nếu không tìm thấy số đáng tin, nói thẳng "không có nguồn đáng tin", đừng bịa.

Cái cuối, “đừng bịa”, quan trọng nhất. Claude được train để giúp đỡ, nên đôi khi sẽ generate ra một số đẹp thay vì nói “không biết”. Câu này giảm tỷ lệ bịa xuống đáng kể.

Web search của Claude vẫn có thể đọc nhầm hoặc tổng hợp sai. Citation chỉ chứng minh nguồn tồn tại, không chứng minh Claude đọc nguồn đúng. Bạn vẫn phải click vào và verify.


Pattern fact-check 3 lớp

Đây là quy tắc không nhân nhượng: bất kỳ số nào sẽ đi vào slide pitch, blog, hoặc decision quan trọng, phải qua 3 lớp.

Lớp 1, Bắt Claude show source

Trong prompt yêu cầu: “Mỗi số kèm 1 link cụ thể, không nói chung chung”. Nếu Claude không show được, không tin.

Lớp 2, Click vào source, đọc đoạn gốc

Đây là bước hay bị bỏ. Bạn phải mở link, tìm số đó trong văn bản gốc. Ba thứ hay sai:

  • Số có thật nhưng đơn vị sai (Claude đọc “tỷ VND” nhưng viết thành “tỷ USD”)
  • Số có thật nhưng năm sai (số 2022 nhưng Claude nói 2024)
  • Số bị tổng hợp sai (báo gốc nói “trừ Hà Nội và TP.HCM”, Claude bỏ qua điều kiện)

Lớp 3, Cross-check với 1 nguồn độc lập

Nếu số đó quan trọng, search nguồn khác, báo Việt, báo quốc tế, hoặc thống kê chính phủ (GSO). Nếu hai nguồn trùng, tin được. Nếu lệch nhiều, dig thêm.

Pattern này tốn 10-15 phút cho 1 số. Nghe lâu, nhưng so với việc đứng pitch trước nhà đầu tư và bị họ chỉ ra số sai, 15 phút là rẻ.


4 dạng research founder hay làm

Dạng 1: Competitor teardown

Bạn cần hiểu đối thủ làm gì, định giá thế nào, đang nói gì với khách. Workflow:

Tôi là founder của [tên công ty], làm [mô tả 1 câu].

Cho tôi một teardown chi tiết về đối thủ sau: [tên đối thủ + website].

Yêu cầu phần nội dung:
1. Họ định vị mình là gì (đọc homepage + about)
2. Giá: nếu có list công khai thì show, nếu không nói "giấu giá"
3. ICP (khách hàng họ target): suy ra từ case study + testimonial
4. Điểm mạnh thật của họ (nhìn từ angle khách hàng)
5. Điểm yếu hoặc gap mà tôi có thể khai thác
6. Họ đang nói gì gần đây (LinkedIn của founder, blog post 3 tháng gần)

Yêu cầu phần phương pháp:
- Search web, đọc website thật, không suy diễn từ "tôi nghe nói".
- Cite từng claim. Nếu không có nguồn, nói "không tìm thấy".
- Cuối cùng kết với 1 câu: "1 thứ duy nhất bạn nên copy" và "1 thứ duy nhất bạn nên KHÔNG làm theo".

Kết quả: 1 báo cáo 800-1200 từ về đối thủ, dùng được luôn cho meeting strategy. Bạn vẫn cần đọc và validate, nhưng tiết kiệm 2-3 tiếng research thủ công.

Dạng 2: Market sizing TAM/SAM/SOM

Đây là chỗ AI hay bịa nhất. Pattern an toàn:

Tôi cần ước tính TAM/SAM/SOM cho [ngách + sản phẩm]. KHÔNG đưa cho tôi 1 con số duy nhất, đưa cho tôi cách tính.

Bước 1: Show top-down, "thị trường X tổng cộng Y tỷ, nguồn Z"
Bước 2: Show bottom-up, "có bao nhiêu khách hàng tiềm năng × bao nhiêu USD/khách"
Bước 3: So sánh hai cách. Nếu lệch nhau >2 lần, dig nguyên nhân.

Quan trọng: cite mỗi giả định. Nếu phải đoán, nói rõ "đây là giả định, không có nguồn".

Sau khi tính xong, đưa cho tôi 3 sensitivity scenario: pessimistic, realistic, optimistic.

Output không phải số “TAM là X” mà là model tính có thể defend được. Khi pitch, bạn nói “giả định của chúng tôi là...” thay vì “thị trường là X”.

Dạng 3: Customer interview synthesis

Đây là use case Claude làm hơn người vì kiên nhẫn đọc hết transcript.

Bạn có 10 cuộc phỏng vấn khách, mỗi cuộc 30-45 phút. Tổng cộng có thể 50-80 trang text. Đọc thủ công mất nửa ngày. Với Claude:

Đây là transcript của 10 cuộc phỏng vấn khách hàng tiềm năng. Mỗi transcript có heading "## Interview [tên] - [date]".

Task của bạn:
1. Đọc hết tất cả.
2. Synthesize ra 5-7 pattern lặp lại (vấn đề, mong muốn, ngôn ngữ họ dùng, alternative họ đang dùng).
3. Mỗi pattern kèm 2-3 quote thật từ transcript (cite tên interviewee).
4. Liệt kê 3 "câu nói buzzword" mà tôi đang dùng nhưng khách KHÔNG dùng, và họ dùng từ gì thay thế.
5. Cuối cùng: 1 câu chốt về "khách hàng thật sự đau gì", bằng ngôn ngữ của họ, không phải của tôi.

Không tóm tắt mỗi interview riêng. Synthesize across.

Cái phần 4, “buzzword bạn dùng nhưng khách không dùng”, là một trong những insight có giá trị nhất. Nó chỉ ra chỗ marketing message của bạn lệch với ngôn ngữ thị trường.

Trước khi paste transcript: anonymize tên thật của khách (Trần Văn A → Khách A). Không paste thông tin nhạy cảm vào Claude trừ khi bạn dùng Claude Enterprise hoặc API có data privacy agreement.

Dạng 4: Ngách mới (niche scan)

Bạn đang nghĩ mở rộng sang ngách mới. Trước khi bay vào, cần biết ngách đó có thật và có ăn được không.

Tôi đang cân nhắc mở rộng sang ngách [mô tả ngách]. Hãy giúp tôi đánh giá ngách này trong 30 phút thay vì 3 ngày.

1. Có bao nhiêu công ty đang làm trong ngách này tại Việt Nam? List top 5-10.
2. Ngách này growing hay shrinking? Cite trend 3 năm gần.
3. Họ tính giá bao nhiêu? Range thấp - cao.
4. Customer pain chính trong ngách (đọc review tiêu cực + forum nếu có)?
5. Có barrier to entry gì? (vốn, license, mối quan hệ, công nghệ)
6. Một "không nên vào" reason nếu có.

Cuối cùng, score ngách này 1-10 dựa trên: market size, growth, competition, fit với năng lực của tôi (tôi sẽ mô tả năng lực sau). Nói rõ score là gut, không phải khoa học.

Output sẽ không là quyết định cuối, nhưng giúp bạn loại 70% phương án rõ ràng tệ và tập trung vào 30% đáng dig sâu.


Cách hỏi để bắt Claude phản biện, không gật đầu

Default của Claude là helpful, tức là có xu hướng đồng ý và mở rộng ý của bạn. Đây là vấn đề khi research, vì bạn cần phản biện.

Hai pattern để bắt Claude challenge:

Pattern “giả thuyết, challenge”

Giả thuyết của tôi: [ý tưởng cụ thể].
Hãy đóng vai một nhà đầu tư hoài nghi.
Liệt kê 5 lý do giả thuyết này sai hoặc thiếu sót.
Không nói "tuy nhiên cũng có điểm tốt là...", chỉ nói lý do nó sai.

Pattern “steelman cả hai bên”

Tôi đang phân vân giữa lựa chọn A và lựa chọn B [mô tả].

Đầu tiên, viết steelman cho A: argument mạnh nhất cho A, giả sử người làm A là người thông minh nhất.
Sau đó, viết steelman cho B: tương tự.
Cuối cùng, list 3 yếu tố mà nếu biết thêm thông tin sẽ thay đổi cán cân.

Không kết luận chọn cái nào. Chỉ làm rõ trade-off.

Pattern thứ 2 đặc biệt tốt cho quyết định lớn. Output là cấu trúc tư duy, không phải đáp án, và đó là cái bạn cần. Bài 5 sẽ đi sâu vào decision workflow.


5 sai lầm khi dùng Claude làm research

  1. Hỏi câu mở chung chung: “Cho tôi biết về thị trường X”. Output sẽ chung chung. Hỏi cụ thể: TAM bao nhiêu, top 5 là ai, growth %.

  2. Không nói rõ năm: “Thị trường F&B Việt Nam bao nhiêu” → Claude trả lời với số 2021. Phải nói “số mới nhất, ưu tiên 2024-2025”.

  3. Tin vào caveat ngầm: Claude hay nói “khoảng 30 tỷ USD”. Chữ “khoảng” là cờ đỏ, hỏi lại “khoảng là khoảng nào, range bao nhiêu”.

  4. Không cross-check: Claude search nguồn A. Bạn không search nguồn B. Hai bạn tin nhau. Cả hai cùng sai.

  5. Copy thẳng vào slide: Số AI generate ra phải qua 3 lớp fact-check trước khi xuất hiện trong văn bản chính thức.


Trước khi sang bài 5

Checklist tự đánh giá:

  • Bạn đã thử prompt research với yêu cầu “cite mỗi câu, đừng bịa”.
  • Bạn đã làm pattern fact-check 3 lớp với ít nhất 1 số liệu.
  • Bạn đã thử pattern “giả thuyết, challenge” để Claude phản biện.
  • Bạn đã ghi nhớ: không số nào vào slide pitch trước khi click vào nguồn gốc.

Bài 5 chuyển từ research sang decision. Khi bạn đã có data, làm sao dùng Claude để giúp bạn ra quyết định mà không bị Claude quyết hộ?

AI cowork tip

Tạo 1 file trong knowledge base của Research Project tên là nguon-tin-cay.md, list những nguồn bạn đã verify đáng tin cho ngành của bạn (GSO, Vietnam Report, Q&Me, EuroMonitor, etc.). Trong system prompt nói “ưu tiên các nguồn trong file này khi search”. Sau 5-10 lần research, bạn sẽ có một “white list” nguồn riêng cho ngành của mình.

Đọc tiếp

Đọc xong rồi?

Muốn cài Founder Copilot cho doanh nghiệp?

30 phút trao đổi miễn phí. Bạn mô tả workflow đang chiếm thời gian, chúng tôi đề xuất 3 cách dùng Claude để rút ngắn, kèm prompt và setup mẫu.