Quy trình AI cho bác sĩ làm nghiên cứu, từ đọc bài báo đến viết Discussion

Lần đầu mình thử dùng AI viết Discussion cho một paper, output là một đoạn 800 từ trông rất hay nhưng không có claim nào trùng với data thật của bài. Đọc lại hai lần mới phát hiện vài citation hallucinated và hai effect size sai hoàn toàn. AI viết hay vì nó nói chung chung, không phải vì nó hiểu paper của mình.

Sau đó mình ngừng dùng AI kiểu "viết hộ mình cái Discussion". Thay vào đó mình build một workflow 5 step, mỗi step AI làm một việc cụ thể mà bác sĩ verify được. Dùng qua nhiều paper với nhiều design khác nhau, cách này giữ cho không hallucination nào lọt vào bản submit.

Bài này map 5 step + tool cụ thể.

Step 1: Đọc paper, NotebookLM

Vấn đề: một systematic review tốt phải screen hàng trăm paper. Đọc full text mỗi paper 30-45 phút thì 50 paper đã là hơn 25 giờ. Bác sĩ lâm sàng không có khối thời gian đó.

Solution: NotebookLM upload PDF, gen audio 10-15 phút discussion. Screen được vài chục paper mỗi tuần trong các khoảng thời gian chết, đủ lọc short-list cho deep read.

Quan trọng: NotebookLM chỉ để screen, paper nào lọt short-list thì vẫn phải đọc full. AI summary có thể miss methodology weakness.

Bài chi tiết workflow: NotebookLM biến bài báo thành audio, screen paper khi không có thời gian ngồi đọc

Step 2: Screen evidence, Claude Project + Zotero

Sau short-list, mình import paper vào Zotero, sync với Claude Project. Mỗi Project chứa 50-100 PDF của một topic. Khi cần check một claim cho Discussion (ví dụ "kỹ thuật A có outcome tốt hơn kỹ thuật B"), mình hỏi Claude Project trực tiếp, Claude search nội bộ trong PDF, trả lời kèm citation.

Workflow này khác hẳn "search Google rồi paste link vào". AI có context full paper của mình, không phải web abstract.

Cách này rút giai đoạn screen cho một review cỡ vài trăm paper từ vài tuần xuống vài ngày. Workflow detail: Zotero + AI workflow, automate literature synthesis.

Step 3: Draft Discussion, Claude với 5 prompt structured

Đây là step AI dễ hallucinate nhất. Cách tránh: mình KHÔNG hỏi "viết Discussion cho data này". Tôi hỏi 5 câu structured:

"Đây là kết quả chính. So sánh với 3 paper tương đồng, agreement và disagreement ở đâu?"
"Methodology limitation nào của bài này có thể explain finding khác paper X?"
"Clinical implication, finding này thay đổi practice ở context nào?"
"Future direction nào logical từ finding này?"
"Reviewer khắt khe sẽ challenge điểm nào trong Discussion này?"

Mỗi prompt mình paste data + claim cụ thể (không phải full paper). Output gọn, mình edit lại theo voice của mình.

5 prompt cụ thể với output examples: 5 prompt Claude mình dùng hằng ngày khi đọc paper.

Step 4: Check citation

Sau khi Discussion xong, bước mình không bao giờ skip: verify từng citation against CrossRef / PubMed / Semantic Scholar. Mỗi reference phải resolve được về một DOI hoặc PMID thật. Một bài 22 reference thường có 1-2 cái lệch, không phải hallucinated hoàn toàn, mà DOI nhập sai trong reference manager.

Catch hallucination citation đặc biệt quan trọng nếu bạn dùng AI suggest reference. AI hay invent author + year combo nghe rất hợp lý nhưng không tồn tại trên DOI registry. Không có bước verify này, một citation ma có thể lọt thẳng vào bản submit.

Step 5: Peer review trước khi submit, Claude với 3 framing

Trước khi submit, mình chạy thêm một round AI peer review. 3 prompt theo 3 voice khác nhau:

"Đọc bài này như reviewer khắt khe, challenge mọi claim không có evidence direct"
"Đọc như editor, bài này có đủ novelty và rigor cho journal đích không? Nếu không, journal nào fit hơn?"
"Đọc như clinician không làm research, chỗ nào confusing, chỗ nào không actionable?"

Output thường flag 5-7 weakness mình chưa thấy. Fix trước khi submit thì reviewer thật ít push back hơn, response letter ngắn hơn.

So sánh Claude vs ChatGPT cho task này: Claude vs ChatGPT cho bác sĩ làm nghiên cứu.

Tổng kết, workflow nguyên tắc

Mỗi step AI làm một việc cụ thể, output có thể verify bằng nguồn ngoài:

NotebookLM screen → bạn vẫn đọc full paper short-list
Claude Project search → có citation từ PDF của bạn
5 prompt Discussion → mỗi prompt 1 claim, không phải full text
Citation check → verify against DOI/PMID database
AI peer review → human reviewer thật vẫn là final gate

AI không thay thế bạn. AI thay thế các step grunt work giữa bạn và paper hoàn chỉnh.

Muốn deep dive từng tool + có template prompt sẵn? Khoá AI cho nghiên cứu trên tuyentranmd.com cover full pipeline + 30+ prompt template + case study workflow thực tế.