GeoCode¶

GeoCode: Interpretable Shape Programs

GeoCode Overview

GeoCode 讨论的是另一件事：先设计一套可解释、可编辑、结构有效的程序空间，再学习如何从点云或草图恢复这套程序的参数。整体上它更接近“形状程序反演”。

核心问题¶

论文关注的核心矛盾是：

如何让程序化建模既保留足够的表达力，又不至于复杂到只有专业建模师才能使用？

已有程序化建模工具常见两类问题：

规则空间太粗，只能表达简单 primitive 组合
节点图或程序虽然灵活，但非专家很难搭建出稳定、可复用的形状程序

GeoCode 的思路是：

先限制在一类精心设计的程序空间里
让这个程序空间显式包含结构关系和高层参数
再训练网络从观测反推出这些参数

因此，它的重点在于“让模型落在一个可控、可解释的程序空间中”，而不是让模型自由写任何代码。

整体思路¶

GeoCode 包含两个互相配合的部分：

程序化建模方法：在 Blender 几何节点系统上构建可解释形状程序
参数恢复网络：从点云或草图预测这些程序参数

text 点云 / 草图 -> 编码器 -> 参数预测头 -> 可解释程序参数 -> Blender 节点程序执行 -> 结构有效的 3D 形状

这里的关键是，网络输出的是驱动节点程序的参数集，不是最终顶点坐标。

1. 程序空间如何设计¶

论文给出的程序空间建立在 Blender Geometry Nodes 上，但开放给模型的并非任意节点；整个系统是围绕一套更可控的建模方法组织起来的。

Triplets¶

GeoCode 用 triplet 组织形状部件。一个 triplet 大致对应：

一条描述主路径的曲线
一条描述截面的 profile curve
一个负责把截面沿路径生成几何的 style node

这种设计的好处是，很多部件都可以抽象成“截面沿曲线生长”的形式，既比简单 cuboid 更灵活，又比开放脚本空间更稳定。

Curve Sampling 与 Attachment¶

程序里大量使用沿曲线采样得到的附着点。这样一来，靠背、横杆、把手等子部件可以通过相对位置而不是硬编码顶点坐标来连接。

这让高层编辑更自然：

改主曲线长度
改截面形状
改附着位置

下游部件会随之传播变化，而不是局部改完后整体结构失稳。

Symmetry¶

论文显式把镜像和旋转对称做成程序关系，而不是让网络隐式学习。

这使它更适合表达椅子、桌子、花瓶等部件重复明显的类别，也解释了它为什么强调“结构有效”而不是单纯拟合表面。

2. 为什么它比早期程序方法更强¶

早期逆向程序建模常依赖较粗的 box/primitive DSL。GeoCode 的改进点在于：

不再把零件限制为少量粗 primitive
允许用曲线和 profile 构造更细的部件
在程序层显式编码附着、对称和结构传播

因此，它恢复出的是一套更接近实际程序化建模逻辑的形状程序，不是“几个盒子的拼装”。

论文也强调，这条路线和直接恢复 CAD command 不同。CAD 操作通常局部有效，但不一定天然维护整体结构传播；GeoCode 则把“高层参数改动会如何影响其余结构”预先写进了程序规则里。

3. 参数恢复网络¶

在恢复阶段，输入可以是：

点云
草图

网络输出是给定程序的参数集合。论文的一个重要点是：只要换了程序，数据生成、训练和推理管线都可以自动适配，不需要重新发明新的表示。

这意味着 GeoCode 的学习任务更像：

已知程序模板
预测离散 / 连续参数
执行程序得到形状

论文在 chairs、vases、tables 等域上验证，并报告对点云、手绘草图和部分 out-of-distribution 草图仍有一定泛化能力。

4. 编辑能力为什么重要¶

GeoCode 的价值不只在恢复，还在于恢复后能直接编辑。

因为输出是可解释参数，用户可以做：

局部结构替换
全局比例修改
在不同样本间复制某些几何属性
在两个形状间做参数插值

而且这些编辑发生在程序层，不是直接改最终 mesh 顶点，所以更容易保持结构一致。

论文专门展示了：

shape mixing
shape interpolation
在保持结构合理的前提下修改局部部件

这也是它与直接生成 mesh 的方法最不同的地方。

5. 实验里能看出的结论¶

论文把 GeoCode 与先前参数预测方法比较，结果显示：

在结构更复杂、非严格对称的形状上更稳
对 out-of-distribution 草图的恢复更合理
非专家在学习其 Blender add-on 后，也能较快搭建新程序

这里最值得注意的不在单一误差数值，而在于：GeoCode 证明了程序空间设计本身可以决定后续恢复和编辑质量。

6. 位置与局限¶

在基于代码 / 脚本的 3D 生成谱系里，GeoCode 代表的是一条受限但可解释的程序空间路线。

它与 MeshCoder 的差别很明显：

GeoCode：先人工设计程序空间，再学习参数
MeshCoder：直接学习开放 Blender Python API 的脚本生成

GeoCode 的优点是结构稳定、可解释性强；代价则是类别覆盖受限，表达力受程序模板设计约束。

因此，它更像“程序化形状建模的神经接口”，而不是通用 3D 代码大模型。

一句话总结¶

GeoCode 的核心意义，在于证明了 3D 生成里可以先设计一套可解释、可传播结构约束的程序空间，再让网络去反推参数；这样得到的是能继续编辑的形状程序，不是黑盒几何结果。