基于TensorFolw的人工智能影像诊断平台工作原理解析

本文分析了天梭流人工智能图像诊断平台的工作原理,希望本文能帮助您更好地了解天梭流。

利用人工智能辅助病理学家诊断样本,不仅可以大大提高医生的诊断效率,还可以减少漏诊,提高诊断准确性。

数字病理图像可以观察组织和细胞的形态。当执行最高数字扫描时,文件大小达到GB级别,需要使用人工智能和系统工程技术来突破这些困难。

在本文中,我将从人工智能系统的构建方法入手,举例说明消化道病理影响辅助系统研发过程中的技术细节。

当然,这是医学科技领域相对陌生的知识。为了让读者更快地理解和吸收,本文还将从产品经理的角度进行解读。

一,什么是病理学?

病理学是通过分析病人的组织、细胞和体液样本来诊断疾病。

然后,病理学为临床医生提供了进一步治疗策略的黄金指标。

这是一张人工智能医学图像,很容易混淆,不是所有的图像都是通过CT、x光、b超和其他分析获得的。以胃癌筛查为例,用扫描仪扫描组织,分析判断其病理图像,形成约1.4GB的图像。

不同疾病的病理来源

病理图像不同,这也是一个技术挑战。

那么在做出病理判断之前,我们需要建立一套训练模型,通过医生标记的图像来加强训练和数据处理。

2。tensorfollow工作原理

当我们解释tensorfollow培训模式时,我们需要了解深入学习的整个过程。

简单工作流

数据源通常来自医院的PACS和RIS系统。在形成数据队列之后,数据被用于增强图像方向的鲁棒性。

另外,我们应该注意扫描仪的倍数,这将导致图像在不同倍数下的鲁棒性。

然后使用张量板来监控模型。张量板是一种可视化工具,可以有效地显示跑步过程中张量流的计算图表、各种指标随时间的变化趋势以及训练中使用的数据信息。

之后,由tensorfollow(病理学)导出的模型被提交到生产环境推理框架(tensorfollow服务)进行自动处理。tensorfolw服务如何工作?

Tensorserving Workflow

tensorfollow serving将病理切片分成由坐标标记的小块。将节点划分成地图后,每个输入切片将由地图任务处理。默认情况下,一块HDFS的大小(默认为64M)用作切片。当然,我们也可以设置块的大小。

map输出的结果将暂时放入环形内存缓冲区(默认缓冲区大小为100兆,由io.sort.mb属性控制)。当缓冲区即将溢出时(默认值为缓冲区大小的80%,由io . sort . spread . percent属性控制),将在本地文件系统中创建一个溢出文件,并将缓冲区中的数据写入该文件。在写入磁盘之前,线程首先根据缩减任务的数量将数据划分为相同数量的分区,即一个缩减任务对应一个数据分区。

这样做是为了避免这样一种尴尬的情况:一些精简任务分配了大量数据,而其他任务分配的数据很少或没有。事实上,分区是散列数据的过程。

然后对每个分区中的数据进行排序。如果此时设置了组合器,排序后的结果将被组合,以将尽可能少的数据写入磁盘。

MAP和reduce机制将分区中的数据复制到相应的reduce任务。Reduce接收来自不同地图任务的数据,并且来自每个地图的数据是有序的。

如果缩减端接受的数据量很小,它会直接存储在内存中(缓冲区大小由Mapred . job . shuffle . input . buffer . percent属性控制,该属性表示用于此目的的堆空间的百分比)。如果数据量超过缓冲区大小的一定比例(由Mapred . job . shuffle . merge . percent决定),数据将被合并,然后溢出到磁盘。

随着溢出文件数量的增加,后台线程将它们合并成一个更大、更有序的文件,以便为以后的合并节省时间。

事实上,mapreduce在地图端和reduce端重复执行排序和合并操作。现在它终于明白为什么有些人说排序是hadoop的灵魂。在合并过程中,会生成许多中间文件(写入磁盘),但Mapreduce会将尽可能少的数据写入磁盘,最后一次合并的结果不会写入磁盘,而是直接输入到reduce函数中。

最终将数据返回到后端。

同样的过程可以转移到研究中去,病理图像有许多相似之处,腺体、息肉、囊肿等都可以用同样的方法应用。

#专栏作家#

Rolia,微信公众号码:pmsummit,每个人都是产品经理专栏作家。海康博士是前联合创始人和产品总监,从事智能医疗领域的产品需求已有5年,致力于智能医疗领域的产品体验设计和新业务模式研究。

这篇文章最初是由产品经理发布的,未经允许不得转载。

标题来自Unsplash,基于CC0协议。

-