CVPR 2025新研究:单图直出CAD工程文件

2025-04-15 01:25:25 · chineseheadlinenews.com · 来源: 量子位

单张图直接就能生成可编辑的CAD工程文件!

来自魔芯科技、NTU等的研究人员提出图生3D新框架,名为CADCrafter。

CADCrafter和过去得到网格(Mesh)或3D高斯泼溅(3DGS)的图生3D方法大不相同。

不管是零件渲染图,还是拍摄的3D打印零件,甚至是随意拍摄的日常生活中的物体,CADCrafter均能够生成的对应的原始CAD文件(以CAD指令的方式表示,包括表征每个几何特征的指令和对应参数)。

并且通过CAD编译器进行编译,可得到直接生产加工的3D文件(如STP格式的文件)。

用户可以通过编辑CAD指令实现对物体的编辑(下图右)。

实验中,从落地实用性、表面质量等特点来看,CADCrafter相较于目前的图生3D方法均有显著提升。

这项研究的作者来自KOKONI 3D(魔芯科技)、新加坡南洋理工大学、新加坡A*STAR、西湖大学、德州大学奥斯汀分校和浙江大学。

通讯作者为魔芯科技创始人Tianrun Chen和新加坡A*STAR研究科学家Fayao Liu。

论文已被CVPR 2025接收。

以下是更多细节。

从图像到高质量CAD模型的端到端生成流程

在现实世界中,大多数人造物体最初都是通过计算机辅助设计(CAD)软件以参数化的方式建模的。

然而,如今大热的3D AI生成内容(3D AIGC)技术,例如TRELLIS等方法,大多仍依赖于“网格模型”(Mesh)作为基础。

问题也随之而来。

相比CAD的参数化设计,网格模型不仅难以理解,更难精确编辑。用户想要修改一个小部件的尺寸?在CAD中只需调整参数,在网格模型中却可能要大动干戈。

而且,这些AI生成的网格模型表面常常不够光滑,边缘也不够锐利,尤其是使用像Marching Cubes这样的算法从隐式函数转换生成网格时,几何质量更容易受到影响。

这种粗糙不清的表面,在需要高质量渲染或动画的应用中,显得格外捉襟见肘。

相比之下,CAD的参数化模型则提供了极高的可控性和精度。它们允许用户直接通过参数调整几何形状,实现快速且精准的修改,大大提升了设计的灵活性与可解释性。

CADCrafter就率先尝试了从Image-to-Mesh到Image-to-CAD的范式转变。

方法概述如下:

1. 基于VAE与Diffusion Transformer的隐空间生成框架

CADCrafter采用了一种结合VAE与扩散模型的两阶段生成架构。

首先,团队训练了一个变分自编码器(VAE),将CAD指令序列映射到一个结构化的隐空间。

接着,在该隐空间中引入条件扩散生成过程:基于Diffusion Transformer(DiT)架构,训练一个扩散生成大模型,输入条件为用户提供的图像,从而实现图像引导下的CAD隐空间采样与生成。

2. 蒸馏策略:从多视图到单视图的高效建模转移

考虑到从单张图像重建CAD模型的挑战性,团队首先构建了一个多视图输入的DiT生成模型,以更稳定地学习图像到CAD空间的映射关系。

随后,通过引入蒸馏机制(使用Ldistill损失),将多视图模型的知识迁移到单视图模型中,从而实现了仅基于单张图像进行高质量CAD生成的能力。

3. 引入基于DPO的可编译性代码检查机制

在CAD生成过程中,CAD指令还需经过CAD内核(CAD Kernel)解析,才能生成可视的3D模型。

然而,若生成指令存在语义错误,例如不闭合曲线等问题,模型构建将直接失败。

为解决这一关键挑战,作者设计了一个代码合理性判别模块,用于判断生成的CAD代码是否能够被成功编译。

作者进一步采用DPO(Direct Preference Optimization)损失,引导模型倾向于生成更可编译、几何结构完整的CAD指令,从而显著提升最终3D模型生成的成功率与实用性。

渲染零件、拍摄的3D打印零件等均能重建

研究团队选取多个标准CAD模型,使用KOKONI SOTA 3D打印机将其打印成实物,并通过拍照获取图像输入。

实验表明,CADCrafter能够基于单张图像,准确生成结构清晰、符合几何特征的CAD建模指令,其生成效果在细节还原度方面优于现有方法。

拍摄日常生活中的物体,CADCrafter也能直接生成其设计制造时可用的工程文件,其表面平面度、棱角等细节均符合物体被生产加工制造时的特点(良好表面、尺寸和几何特征均可编辑)。

这一成果不仅展示了CADCrafter在建模精度上的突破,也展现了其在实际应用场景中的可行性。

例如,在制造与维修领域,工程师可通过拍摄现有零件照片,快速生成可编辑的CAD模型,进而加速原型设计或零件重建流程。

团队相信,CADCrafter为AI辅助工业设计提供了新的解决方案,其从Image-to-Mesh到Image-to-CAD的范式转变,有助于推动图像驱动的AI 3D建模向真正可落地应用迈出关键一步。


    24小时新闻排行榜更多>>
  1. 黄仁勋到访中国,一个重要节点
  2. 美欧为俄乌停火举行巴黎会谈
  3. 美专家:五迹象显示美中可能正迈向热战
  4. 川普宣布对中国船舶收费 重振美国造船业
  5. 美稀土公司MP Materials宣布停止对华出口
  6. 419上街“反共护台湾” 罢团:大罢免是善良对邪恶的对决
  7. 中情局局长:中共是美国史上最大的威胁
  8. 纽约时报:川普已经搞砸了关税战
  9. 山西订婚强奸案:他们都想有个“铁链女”
  10. 川普吹嘘关税收入被戳破 人手不足正压垮美国海关
  11. 针对哈佛违反民权法行为 美众议院启动调查
  12. 全美160所大学逾千国际学生被吊销签证
  13. 一人扛公司六成营收 王一博遭自家节目除名
  14. 076首舰真身曝光,电弹“买一送一”
  15. 为将300亿和解金降为4.5亿,他捐给川普100万
  16. 奈飞一季度利润创历史新高
  17. 克宫:30天禁令已“到期”
  18. 中共军工系清洗持续 航天科工总经理换人
  19. 加大圣地亚哥分校35国际学生签证被吊销
  20. 美国蔬果价格大涨:个别暴冲75%
  21. 平安银行一季度盈利141亿
  22. 高人揭晓江泽民诡异往事“干校”履历被瞒
  23. 路透:SpaceX领跑“金色穹顶”导弹防御系统竞标
  24. “故意泄露国家秘密”中共地质系统高官获刑13年
  25. 库克做对这件事"让苹果暂逃一劫",华邮揭他幕后行动
  26. 【直播】川普签署行政令并答记者问(4/17)
  27. 这份关于中国的民调出乎两党意料
  28. 中共对川普施毒计,对准关键目标;川普手上还有好牌
  29. 美军一个动作,让伊朗做最坏打算
  30. 湖南机场集团董事长被曝饭局后性侵同桌女子
  31. 全球监控与人工智能崛起 精神战争正在发生
  32. 南昌一业主119万房子4年后仅值40万
  33. 中共给失业毕业生发低保 分析:贸易战下维稳
  34. 法国“爱国者”党主席:马克龙被美国代表羞辱
  35. 英伟达总裁突访北京 引发美国会议员质疑
  36. 俄罗斯警告这国:找死
  37. 川普或放弃斡旋俄乌协议
  38. 高盛:极端情况下美恐抛售8千亿美元中概股
  39. 战争边缘的中美关系:五大黄灯警示冲突升级风险
  40. 美加速处理庇护案 有法律缺涎剔需听证可驳回
  41. 川普定调新冠源头 “实验室泄漏论”翻盘登场
  42. 习刚走越南变脸 越美有独特纽带 中共傻眼
  43. 075型两栖攻击舰开放参观?
  44. 中共怕乱?贸易战下拟给失业毕业生发低保
  45. 美国宣布:对中国建造和运营船只征收新港口费
  46. 英法院裁定跨性别者"不是女性",J.K.罗琳抽雪茄举杯
  47. 中共在俄参与武器生产?泽伦斯基首次公开指控军援俄
  48. 川习“哥儿俩斗” 首先是中国麻烦大
  49. 美中网攻指控升级 专家:加速双边脱钩
  50. 川普与鲍威尔,难逃一战
  51. 美国“关税难民”,涌进中国电商平台
  52. 美检方正式提告"枪杀健保CEO"学霸,罪成恐被处死
  53. 美国批准Capital One银行收购Discover信用卡
  54. 沃尔玛与中国供应商的生死博弈
  55. 在川普发动贸易战之际 中国寻求与欧盟重启关系
  56. 关税威胁引发末日抢购潮
  57. 贵州一人家出门没拔充电器 家被烧光
  58. 司法部请求撤销帮移民返美裁决 上诉法院驳回
  59. 乌克兰宣布最新制裁名单 点名三家中国企业
  60. 中超浙江队外援布彭扎在中国坠亡