Claude tốt hơn ChatGPT cho nghiên cứu — câu trả lời ngắn này đúng nhưng quá rộng. Sau 1 năm dùng cả 2 cho loạt paper chẩn đoán hình ảnh dị tật hậu môn trực tràng ở trẻ sơ sinh (1 đã đăng Journal of Pediatric Surgery 2026, 1 đang review tại Pediatric Surgery International, 1 đang chuẩn bị), mình thấy mỗi tool thắng ở task khác nhau. Bài này test cùng 5 task trên cả 2 tool, output cụ thể.
Caveat: mình dùng Claude Sonnet 4.5 + Claude Max plan, ChatGPT GPT-4o + Plus plan. Free tier kết quả khác.
Task 1: Literature search short-list
Prompt: "Tôi cần short-list 10 paper về TPUS diagnostic accuracy in anorectal malformation 2020-2026. Yêu cầu: peer-reviewed, sample n≥30, có sensitivity/specificity report."
Claude: trả về 10 paper với title, journal, year, DOI, 1 dòng tóm tắt mỗi paper. 8/10 verified trên PubMed (mình check sau). 2 paper hallucinated — author kết hợp năm sai.
ChatGPT: trả về 12 paper, structured table. 6/12 verified, 6/12 hallucinated. Tệ hơn Claude.
Winner: Claude — nhưng vẫn phải verify mỗi citation qua ResearchCheck. AI suggest reference đều có rủi ro hallucinate.
Task 2: Draft Discussion (đoạn 300 từ)
Prompt: "Đây là kết quả paper TPUS của mình: TPUS sensitivity 89%, specificity 92%, n=80. So sánh với 3 paper short-list, viết đoạn Discussion 300 từ."
Claude: 320 từ. Structure: agreement với Niedzielski 2024, disagreement với Long 2024 (explain bằng population difference: high vs low ARM ratio). Mention limitation single-center. Reasoning chain rõ ràng.
ChatGPT: 280 từ. Liệt kê 3 paper với "consistent with prior studies" generic. Không explain disagreement. Methodology limitation generic.
Winner: Claude — Claude bám claim cụ thể, ChatGPT viết hay nhưng nông.
Task 3: Methodology critique
Prompt: "Reviewer khắt khe sẽ challenge methodology paper này điểm nào? Liệt kê 5 điểm cụ thể."
Claude: 5 điểm chi tiết — selection bias (single center bias), index test interpretation blind hay không, reference standard timing gap, MRI sub-cohort size 22 chưa đủ power cho subgroup, statistical inflation từ multiple comparison.
ChatGPT: 5 điểm generic — sample size, generalizability, blinding, follow-up duration, conflict of interest. Đa số không dính methodology paper.
Winner: Claude rõ ràng — Claude đọc context paper, ChatGPT trả lời theo template chung.
Task 4: Extract data table từ paper khác
Prompt: Upload PDF Niedzielski 2024 (paper 14 trang), prompt "Extract Table 2 (diagnostic accuracy by ARM type) thành CSV format".
Claude: Extract đúng structure 5 row × 4 column, value chính xác 100% so với paper.
ChatGPT: Extract 4 row (miss 1 row), 1 value sai (89% thay vì 87%).
Winner: Claude — extraction precision quan trọng cho meta-analysis. Paper meta-analysis của mình extract 200 paper × 6 fields = 1200 data points, 1% error rate = 12 sai số. Không chấp nhận được.
Task 5: Response letter to reviewer
Prompt: "Reviewer 4 said TPUS validation chưa convincing vì single-center. Viết response letter politely mà confident, 200 từ."
Claude: Tone formal-academic, structure: ack concern → counter argument 1 (multi-operator validation trong center), counter 2 (phân bố thể bệnh trong cohort khớp với dịch tễ VN), commitment to multi-center prospective. 195 từ.
ChatGPT: Tone slightly defensive, structure tương tự nhưng dùng cụm "We respectfully submit" hơi formal-cliché. 180 từ.
Tie. Mình thường merge 2 output, lấy structure Claude + 1-2 phrase ChatGPT.
Tổng kết — chọn nào cho task nào
| Task | Winner | Lý do |
|---|---|---|
| Literature search | Claude | Hallucinate ít hơn |
| Draft Discussion | Claude | Reasoning bám claim |
| Methodology critique | Claude | Đọc context paper |
| Data extraction từ PDF | Claude | Precision cao |
| Response letter | Tie | Cả 2 OK với edit |
| Image/table parsing | ChatGPT | Vision tốt hơn (chưa test trong batch này) |
| Speed (≤30s response) | ChatGPT | Nhanh hơn ~2x |
Mình dùng Claude làm primary cho 90% task nghiên cứu. ChatGPT khi cần image OCR (table chụp từ paper cũ) hoặc speed (≤30 giây response cho task đơn giản).
Workflow tổng
5 task này nằm trong workflow AI 5 step cho nghiên cứu của mình. Pillar: Workflow AI cho bác sĩ làm nghiên cứu — từ đọc paper đến viết Discussion.
5 prompt structured cho draft Discussion (mình paste 4-5 lần/tuần): 5 prompt Claude mình dùng hằng ngày khi đọc paper.
Khoá AI nghiên cứu
Module 2 khoá AI cho nghiên cứu trên tuyentranmd.com cover deep so sánh Claude/ChatGPT/Gemini/local model cho 12 task nghiên cứu cụ thể. Plus prompt template + decision tree pick tool theo task.