Lần đầu mình thử dùng AI viết Discussion cho ARM paper, output là 1 đoạn 800 từ trông rất hay nhưng không có claim nào trùng với data thật của bài. Mình đọc lại 2 lần mới phát hiện 3 citation hallucinated, 2 effect size sai hoàn toàn. AI viết hay vì nó nói chung chung, không phải vì nó hiểu paper của mình.
Sau đó mình ngừng dùng AI kiểu "viết hộ tôi cái Discussion". Thay vào đó mình build 1 workflow 5 step, mỗi step AI làm 1 việc cụ thể bác sĩ verify được. 6 tháng dùng cho nhiều paper (paper chẩn đoán bằng siêu âm đã đăng JPS 2026, paper phân tích gộp, và vài paper phương pháp khác), workflow này save mình ~40% thời gian, không sót hallucination.
Bài này map 5 step + tool cụ thể. Bạn copy được toàn bộ pipeline.
Step 1: Đọc paper — NotebookLM
Vấn đề: 1 systematic review tốt screen 100-200 paper. Đọc full text mỗi paper 30-45 phút thì 50 paper = 25 giờ. Bác sĩ không có 25 giờ rảnh.
Solution: NotebookLM upload PDF, gen audio 10-15 phút discussion. Mình nghe khi lái xe đi viện, lúc trực đêm không có ca. 1 tuần screen được 30-40 paper, đủ short-list cho deep read.
Quan trọng: NotebookLM chỉ để screen — paper nào lọt short-list thì vẫn phải đọc full. AI summary có thể miss methodology weakness.
Bài chi tiết workflow: NotebookLM biến bài báo thành audio — mình nghe lúc trực 3AM
Step 2: Screen evidence — Claude Project + Zotero
Sau short-list, mình import paper vào Zotero, sync với Claude Project. Mỗi Project chứa 50-100 PDF của 1 topic. Khi cần check claim trong Discussion ("staged repair có outcome tốt hơn single-stage"), mình hỏi Claude Project trực tiếp — Claude search nội bộ trong PDF, trả lời với citation.
Workflow này khác hẳn "search Google rồi paste link vào". AI có context full paper của mình, không phải web abstract.
Mình dùng cho paper phân tích gộp của mình — 200 paper screen trong 2 ngày, không phải vài tuần như cách cũ. Workflow detail: Zotero + AI workflow — automate literature synthesis.
Step 3: Draft Discussion — Claude với 5 prompt structured
Đây là step AI dễ hallucinate nhất. Cách tránh: mình KHÔNG hỏi "viết Discussion cho data này". Mình hỏi 5 câu structured:
- "Đây là kết quả chính. So sánh với 3 paper tương đồng — agreement và disagreement ở đâu?"
- "Methodology limitation nào của bài này có thể explain finding khác paper X?"
- "Clinical implication — finding này thay đổi practice ở context nào?"
- "Future direction nào logical từ finding này?"
- "Reviewer khắt khe sẽ challenge điểm nào trong Discussion này?"
Mỗi prompt mình paste data + claim cụ thể (không phải full paper). Output gọn, mình edit lại theo voice của mình.
5 prompt cụ thể với output examples: 5 prompt Claude mình dùng hằng ngày khi đọc paper.
Step 4: Check citation — ResearchCheck
Sau khi Discussion xong, mình paste manuscript vào ResearchCheck (researchcheck.vercel.app). Tool verify mỗi citation against CrossRef/PubMed/Semantic Scholar 240M paper. Kết quả: bài 22 reference, 21 verified, 1 flagged "DOI not found" — paper đó tồn tại nhưng DOI sai trong reference manager Zotero của mình.
Catch hallucination citation đặc biệt quan trọng nếu bạn dùng AI suggest reference. AI hay invent author + year combo nghe hợp lý nhưng không tồn tại trên DOI registry.
Tool này mình build 1 năm trước, chính xác vì lo chính kiểu lỗi này. Free tier không cần API key.
Step 5: Peer review trước khi submit — Claude với 3 framing
Trước khi submit JPS hoặc PSI, mình chạy thêm 1 round AI peer review. 3 prompt theo 3 voice khác nhau:
- "Đọc bài này như reviewer khắt khe — challenge mọi claim không có evidence direct"
- "Đọc như editor — bài này có đủ novelty và rigor cho Q1 không? Nếu không, journal nào fit hơn?"
- "Đọc như clinician không research — chỗ nào confusing, chỗ nào không actionable?"
Output thường flag 5-7 weakness mình chưa thấy. Mình fix trước khi submit thì reviewer thật sẽ ít push back, response letter ngắn hơn.
So sánh Claude vs ChatGPT cho task này: Claude vs ChatGPT cho bác sĩ — mình test trên paper của mình.
Tổng kết — workflow nguyên tắc
Mỗi step AI làm 1 việc cụ thể, output có thể verify bằng nguồn ngoài:
- NotebookLM screen → bạn vẫn đọc full paper short-list
- Claude Project search → có citation từ PDF của bạn
- 5 prompt Discussion → mỗi prompt 1 claim, không phải full text
- ResearchCheck citation → verify against 240M paper database
- AI peer review → human reviewer thật vẫn là final gate
AI không thay thế bạn. AI thay thế các step grunt work giữa bạn và paper hoàn chỉnh.
Mình đang dùng workflow này cho các dự án phương pháp đang triển khai. Bạn muốn deep dive từng tool + có template prompt sẵn? Khoá AI cho nghiên cứu trên tuyentranmd.com cover full pipeline + 30+ prompt template + case study từ chính nghiên cứu của mình.