使用ONNX搭配Phi-3-vision模型進行圖像理解

Estimated read time 1 min read

微軟最近開源多模態模型Phi-3-vision-128k-instruct,能處理圖片和文字,且支援128k上下文,應用在圖像辨識(OCR)、圖像理解、資料表分析…等。

 

​ 微軟最近開源多模態模型Phi-3-vision-128k-instruct,能處理圖片和文字,且支援128k上下文,應用在圖像辨識(OCR)、圖像理解、資料表分析…等。Continue reading on RiCosNote »   Read More AI on Medium 

#AI

You May Also Like

More From Author

+ There are no comments

Add yours