Academics | The Hong Kong University of Science and Technology

乳腺癌基准测试
们开发了一个乳腺癌基准测试,用于评估人工智能模型在病理图像分析方面的性能。我们从合作医院获取了10个全视野切片图像(WSI),由专业病理医生对坏死、神经受侵、钙化、脉管瘤栓、导管原位癌(DCIS)和浸润性导管癌(IDC)等六个乳腺癌特征区域进行了精确标注,最终获得了约1000张高质量的图像数据。利用这些数据,我们对多模态大型语言模型(MLLM)和CLIP类模型在上述六个乳腺癌诊断任务上进行了评测。CLIP模型的测试使用预定义的模板和近义词表,基于输入图像与预设文本的相似度得分进行评估;MLLM模型的测试则结合了模板和提示,引导模型在回答病理相关问题时以“是”或“否”作出回应。通过这个乳腺癌基准测试,我们旨在评估人工智能模型在病理图像分析中的性能,为研究者提供一个统一的平台,促进人工智能在乳腺癌诊断领域的发展。