iModel Analytics Studio 用户指南
介绍
本指南涵盖了 iModel Analytics Studio 的基础使用方法,引导你完成平台的第一步操作,同时也提供更高级的重要概念和平台配置建议。
工作区(Workspaces)
当你启动 iModel Analytics Studio 时,会出现启动窗口,询问你定义 iModel 工作区(workspace)。
iModel 工作区是本地计算机上的一个文件夹,用于存储工作流(workflows)、节点设置,以及工作流生成的数据。
工作区中的工作流、组件和数据可以通过侧边栏导航中的 空间浏览器(Space Explorer) 来访问。
你可以稍后通过菜单切换工作区(选择 “Switch workspace”)。
用户界面(User Interface)
选择工作区后,点击 “Launch”,启动 iModel Analytics Studio 的用户界面 —— 即 iModel 工作台(Workbench)。
如果之前打开了多个工作流,在现代 UI(Modern UI)下只会显示当前活动工作流及其所属标签页。点击第一个标签(带有 iModel 徽标)会回到 “入口页(Entry Page)”。
界面主要由以下几个部分组成:应用标签页、侧面板、工作流编辑器以及节点监视器(Node Monitor)。
入口页(Entry Page)
点击 “Home” 标签可以打开入口页。
在这里,你可以看到:
最近打开的工作流(Recent)
本地空间(Local space)
iModel 社区 Hub(Community Hub)挂载点(如果已配置)
在入口页,你还可以新建工作流(点击 “+” 按钮),或通过 Hub 登录以访问远程空间。
工作流编辑器 & 节点(Workflow Editor & Nodes)
工作流编辑器是你搭建工作流的地方。工作流由一个个节点(nodes)组成,每个节点代表一个任务。
创建新工作流:可以在空间浏览器里选择 “Create workflow”,给它命名后点击 “Create”;也可以通过工作流标签栏的 “+” 建一个空白流程。
添加节点:可以从节点库(Node Repository)中拖拽到画布上;也可以通过 “快速节点添加面板(Quick Node Adding Panel)” 双击画布打开推荐节点面板;将兼容的节点拖进来。
连接节点:把一个节点的输出端口(output port)拖到另一个节点的输入端口(input port)即可连接。对于某些节点,你可以点击 “+” 来添加动态端口。
节点基本信息
节点在画布上是一个带有输入/输出端口的小方框。
端口类型可以多样(例如数据表、模型等),连接时必须类型匹配。
节点状态通过 “红、黄、绿” 灯(traffic light)显示:
红:未配置(not configured)
黄:已配置(configured)
绿:已执行(executed)
你可以通过节点的上下文菜单(右键)或操作栏来配置、执行、取消或重置节点。重置操作会将节点及其后续节点的状态清除(输出也被清除)。
节点端口(Ports)
节点可以有多个输入/输出端口。数据从某个节点的输出端口传到另一个节点的输入端口。除了普通数据(如数据表)之外,端口还可以处理模型、数据库查询等不同类型。
如果某些输入端口是可选的(optional),它们在 UI 上可能是空的,这代表该输入可以为空。如果是必需端口(mandatory),必须连接才能执行节点。
添加节点方式总结
从节点库拖拽节点到画布
双击节点库中的节点
使用快速节点添加面板(Quick Node Adding Panel):双击画布或拖一个端口到画布,会出现推荐节点。
使用推荐面板时,如果你愿意允许匿名使用数据,可以在启动或切换工作区时同意 “帮助改进 iModel” 对话框。你也可以在偏好设置(Preferences)里关闭社区节点推荐。
节点替换、复制和注释
移动和复制:节点可以拖动移动,要复制的话,选中后右键 Copy,然后在目标工作流粘贴。
替换节点:把一个新节点拖到已有节点上,会出现替换标志。释放鼠标即可替换。
注释 / 标注:
节点标签(Node Label):双击节点底下文本框来为单个节点添加注释。
工作流注释(Workflow Annotation):右键画布,选择 “New workflow annotation” 添加注释框。你还能通过注释模式(按 T 键,或点击界面上的注释图标)进入编辑。
注释框文本支持简单标记语法(heading, bullet list, 编号列表等)。
连接 iModel Hub(Connect to Hub)
默认情况下,你可以通过 “Home” 页签连接到你的 iModel 社区 Hub(Community Hub)。
如果你有其他 Hub 实例(例如企业 Hub),可以通过 “Preferences → iModel Explorer → New …” 来添加新的 Hub URL。添加后,在 Home 页签就可以选择这个 Hub 并登录。
登录后,在空间浏览器(Space Explorer)里可以看到该空间里的工作流、组件等内容。
切换到经典界面(Classic UI)
你可以通过菜单在现代 UI(Modern UI)和经典 UI 之间切换:
在现代 UI 中选 “Switch to classic user interface”。
在经典 UI 中点击 “Open Modern UI” 可以回到现代界面。
注意:工作流元素(比如连接器、注释)在两种 UI 中的视觉展现可能略有不同,它们不会完全一样。
空间浏览器(Space Explorer)
空间浏览器是管理你的工作流、文件、组件、文件夹等内容的地方,无论是本地空间还是远程 Hub。
你的空间可以是:
本地工作区(workspace)
iModel 社区 Hub 的用户空间
团队空间(如果有团队 Hub)
你可以在空间浏览器顶部选择不同空间。空间浏览器里可以创建新工作流、新文件夹、导入工作流、上传/下载、重命名、删除等操作。将一个文件拖放到画布时,iModel 会自动创建相应的文件读取节点并预配置它。
从 iModel Hub 打开工作流
你可以从 Hub 拖拽工作流到 iModel Analytics Studio 中以打开它。具体方法:
登录到你的 Hub 实例
找到你想要打开的工作流
拖拽该工作流(或其 URL)到 iModel Analytics Studio 界面
选择某个版本(如果版本管理可用),即可以该版本在本地打开和交互
构建工作流(Building Workflows)
新建工作流后,画布为空。你可以按之前说的方法向其中添加节点。
推荐节点(Workflow Coach):在已有节点的输出端口上拖拽可以触发推荐面板,iModel 会给出兼容节点建议。
有些节点支持动态端口(dynamic ports):在悬停时点击 “+” 可以新增端口;支持不同类型端口时,可以选择端口类型。
你还可以在两个节点之间插入节点:把节点从库中拖到连接线上,释放即可插入。
工作流版本管理(Versioning Workflows)
iModel Analytics Studio 支持版本管理(通过 Hub 上传版本):
当你上传工作流到 Hub 空间时,可以创建版本(versions)。
创建版本:打开工作流,点击其名称旁的版本历史图标 → 选择 “Version history” → 在弹出的对话框中点击 “Create version” → 填写名称和描述 → 点击 “Create”。
查看版本历史:在 “Version history” 对话框中可以看到所有版本(包括草稿版本),显示版本名、描述、创建时间、创建人等信息。
展示一个版本:在版本历史里选择某个版本 → 点击 “Show this version” → 该版本会在画布里打开供你查看编辑。
恢复版本:选择一个之前版本 → 点击 “Restore this version” → 系统会提示确认,因为恢复会覆盖当前未保存更改 → 恢复后该版本作为草稿。
删除版本:在版本历史中点击某版本旁的删除图标即可删除该版本。
节点库(Node Repository)
已安装的所有节点会集中在节点库中。
可以从节点库拖节点到画布,或双击节点。
在节点库顶部有搜索栏,你可以输入关键词来查找节点。
节点库可以以三种视图显示:网格(grid)、列表(list)、树(tree)。
节点描述(Node Description)
你可以选中画布上的节点,然后在侧边栏里查看该节点的描述(功能、配置选项、端口类型等)。
也可以在节点库里,将鼠标悬停在节点上然后点击信息图标(info)来打开该节点的描述面板。
工作流描述(Workflow Description)
在侧边栏描述面板里,可以看到当前活动工作流或选中组件的说明。
点击笔图标可以编辑描述,加链接、标签(tags)等。
支持基本格式语法:
无序列表(使用 * )
有序列表(使用 1. )
加粗、斜体、下划线等(Ctrl + b, i, u)
编辑组件(component)描述:需要先打开该组件(右键 → Component → Open component),然后在它自己的画布里编辑描述。
iModel AI 助手(AI Assistant)
iModel 包含一个 AI 助手,帮助回答你的提问、协助构建定制工作流,从而简化数据分析任务。
安全与隐私
在与 AI 助手集成时,iModel 会安全地传输部分数据给通用模型提供方(如 OpenAI 或 Microsoft Azure OpenAI)。
传输内容:用户在助手侧边栏输入的文本,以及在 “构建模式(Build 模式)” 下某些节点表结构(列名、数据类型等)。但实际的数据(如记录值)不会被共享。
所用模型:
问答模式(Q&A):使用更小型模型(如 GPT-4.1-nano)
构建模式(Build):使用更完整模型(如 GPT-4.1)
AI 助手不由 iModel 自身托管,而是直接连接到提供商的 API。
使用方式
登录你的 iModel Hub 帐户后,即可启用 AI 助手。
在偏好设置里(Preferences),你可以选择助手连接到哪个 Hub 实例,以及是否启用 AI 助手。
启用后,AI 助手默认显示在现代 UI 的侧边栏。
进入 AI 助手后,你必须先接受隐私免责声明(disclaimer),确认哪些信息会被共享。
模式
AI 助手有两种模式:
问答模式(Q&A)
用于提出关于 iModel 功能的问题
回答可能会推荐适合的节点;如果节点已安装,可直接拖入画布;若未安装,会提供 Hub 安装链接
你可以查看答案来源(source),以及相关资源(如工作流、论坛、文档)
能对答案点赞 / 点踩提供反馈
构建模式(Build)
用于根据你的提示扩展工作流
当前要求从已有节点(已有数据端口)开始构建,不能从空白画布启动
在 “快速节点添加面板” 中可以选择 “Build with K-AI”(即 “与 AI 构建”),然后输入提示语,AI 会建议节点并添加注释
关闭 / 禁用 AI 助手
通过偏好设置:进入 Preferences → Modern UI → AI Assistant,取消勾选 “Enable the AI Assistant”
通过配置文件(iModel.ini):打开 .ini 文件(安装目录下),添加条目:
-Dorg.knime.ui.feature.ai_assistant=false(这里 “knime” 是原名,若你的开源版里也直接用了这个配置名可保留,但可以在文档里注释:这是旧配置项名。)
在 .ini 中的设置优先级高于配置文件或偏好设置。
工作流监控(Workflow Monitor)
在侧边栏导航中可以打开 “Workflow Monitor” 选项卡。
这个界面用于查看工作流执行中出现的错误和警告。
当节点出错或警告时,你可以点击对应图标,界面会自动跳转到出问题的节点(如果它在组件/元节点里,也会定位到相应层级)。
节点监视器(Node Monitor)
节点监视器面板通常在界面下方。
可用于查看中间输出,比如某个端口的数据预览(Preview)或流变量(Flow Variables)。
切换到 “Statistics” 视图可以看到数据的基本统计信息。
支持将表或统计视图分离出来,在单独窗口中查看(点击对应的图标)。
小地图(Minimap)
在工作流编辑器的右下角有一个小地图,显示整个工作流的鸟瞰图。
当前视图用矩形高亮表示。
你可以拖动这个矩形快速导航到画布上其他区域。
还可以调整缩放(zoom)、平移(pan)或隐藏小地图。
帮助(Help)
通过点击界面右上角的 “Help” 按钮,你可以访问:
键盘快捷键(Keyboard shortcuts)
学习资源(如速查表、快速入门指南、文档)
社区论坛(Community Forum)
关于页面(About):显示当前 iModel Analytics Studio 版本、安装细节等
开源软件组件版权信息等
管理工作流状态与日志(Managing Workflow States & Logs)
节点重置 & 工作流执行
当你重置节点时,该节点及其后续节点会从 “已执行(executed)” 状态变回 “已配置(configured)”,其输出结果将被清除。
如果你保存处于已执行状态的工作流,输出数据也会一起保存。这可能导致大型数据集生成非常大的工作流文件。
因此,建议在保存之前重置工作流(如果数据可以重新获取),这样只保存节点配置,而不保存中间结果。
iModel 日志 & 节点操作
iModel 会将所有节点操作(创建、配置、执行)记录在日志中。
日志文件 imodel.log(原为 knime.log)保存在工作区的 .metadata/imodel/ 目录中。
在经典 UI 中,可以通过 “View → Open log” 来查看日志。
日志记录目标(Logging Targets)
iModel 支持多种日志输出目标:
全局日志文件 imodel.log(记录平台和节点事件)
每工作流单独日志文件
平台日志(如 Eclipse 底层事件)
标准输出/错误(Terminal)
控制台视图(Console view in GUI)
日志文件有最大大小限制,满了会轮转(rotate)压缩归档。
默认日志级别 (logging level) 可配置为 DEBUG, INFO, WARN, ERROR, OFF。
修改日志级别
进入 Preferences → iModel(原 KNIME)中可以调整日志级别。
你也可以启用/禁用每工作流日志。
如果希望把全局消息也写入每流程日志,可以在偏好设置中打开对应选项。
配置来源优先级
日志配置可能来自多个地方,优先级如下(低到高):
默认 Log4j 配置(项目工作区目录)
内建默认设置
自定义配置文件(如 .epf,可通过 Hub 分发)
用户在偏好设置里设置
配置 iModel Analytics Studio
偏好设置(Preferences)
通过界面右上角打开 Preferences。
常见子类包括:数据库驱动、更新站点 (update sites)、界面外观等。
网络连接 (Network Connections):可以配置代理(proxy)、手动 / 直接 / 本地(native)提供商。
代理认证 (Proxy Authentication):支持基本用户名/密码认证,凭证存储在安全存储 (Secure Storage) 中。
排除某些主机不走代理(Proxy Exclusion):可以使用通配符 (*) 排除 host。
iModel 配置
在 “iModel” 子项中,你可以定义日志级别、节点线程数 (最大线程数) 以及临时文件夹路径。
你还可以选择是否同意 “帮助改进 iModel”(匿名发送使用数据),这会启用节点推荐功能。
界面 (Modern UI) 配置
在 “Modern UI” 子项里,你能选择:
要在节点库 / 推荐里包含哪些节点
鼠标滚轮操作对应行为
切换 UI 类型时是否提示关闭项目
节点配置对话框显示方式(内嵌 / 新窗口)
AI 助手连接到哪个 Hub,以及是否启用 AI 助手
经典 UI 设置
在经典 UI 子项里,可以设置控制台视图日志级别(默认 WARN),以及是否显示确认对话框(比如重置节点、删除节点等)。
你还可以配置在某些操作之前是否自动执行前置节点(如保存、加载旧版等)。
表格后端 (Table Backend)
从版本 v4.3 开始,iModel 引入了 列式后端 (Columnar Backend),基于 Apache Arrow,可优化内存使用。
你可以为单个工作流设置后端类型:在描述 (Description) 面板里打开工作流配置 → “Table Backend” 标签 → 选择列式 (Columnar) 或传统后端。
你也可以设置默认后端:在 Preferences → Table Backend 中选择列式后端作为默认。
列式后端还有缓存参数可调节(off-heap 缓存)。调整时要注意不要超出物理内存,否则可能不稳定或崩溃。
在 Linux 上,如果使用列式后端可能会出现高内存占用问题,这是因为 JVM 与 glibc 本地内存分配器 (malloc) 交互不优。一个常用的 workaround 是设置环境变量 MALLOC_ARENA_MAX=1。
设置 imodel.ini (原 knime.ini)
安装 iModel Analytics Studio 后,会有一个 imodel.ini(或仍以 knime.ini 命名,如果未改)配置文件,位于安装目录中。
你可以使用文本编辑器打开并修改它(例如调整内存、系统属性等)。
-Xmx 参数控制 JVM 最大堆内存(例如 -Xmx8G 表示 8 GB)。推荐值为系统内存的一半左右。
常用设置示例:
压缩算法(-Dimodel.compress.io 原 knime.compress.io):如 SNAPPY、GZIP、NONE
小表 (small table) 缓存大小(-Dorg.imodel.container.cellsinmemory)
缓存策略 (-Dimodel.table.cache:LRU 或 SMALL)
URL 超时参数(-Dimodel.url.connectTimeout、-Dimodel.url.readTimeout)
是否阻止 Chromium 外部请求(-Dchromium.block_all_external_requests)
Python 证书 (cacerts) 来源(-Dimodel.python.cacerts)
运行时选项(Runtime Options)
iModel 基于 Eclipse,因此支持 Eclipse 的运行时参数。
你可以在命令行启动时传递参数,也可以把它们写在 imodel.ini 文件中。
命令行参数必须写在 -vmargs 之前(如果在 .ini 中配置)。
对于头 less(无 GUI)运行(例如批量执行 / container 部署),也支持相应的命令行参数。