🌬️ iModel 用户指南
🌬️

iModel Analytics Studio 用户指南

介绍

本指南涵盖了 iModel Analytics Studio 的基础使用方法,引导你完成平台的第一步操作,同时也提供更高级的重要概念和平台配置建议。

工作区(Workspaces)

当你启动 iModel Analytics Studio 时,会出现启动窗口,询问你定义 iModel 工作区(workspace)。

iModel 工作区是本地计算机上的一个文件夹,用于存储工作流(workflows)、节点设置,以及工作流生成的数据。

工作区中的工作流、组件和数据可以通过侧边栏导航中的 空间浏览器(Space Explorer) 来访问。

你可以稍后通过菜单切换工作区(选择 “Switch workspace”)。

用户界面(User Interface)

选择工作区后,点击 “Launch”,启动 iModel Analytics Studio 的用户界面 —— 即 iModel 工作台(Workbench)。

如果之前打开了多个工作流,在现代 UI(Modern UI)下只会显示当前活动工作流及其所属标签页。点击第一个标签(带有 iModel 徽标)会回到 “入口页(Entry Page)”。

界面主要由以下几个部分组成:应用标签页、侧面板、工作流编辑器以及节点监视器(Node Monitor)。

入口页(Entry Page)

点击 “Home” 标签可以打开入口页。

在这里,你可以看到:

  • 最近打开的工作流(Recent)

  • 本地空间(Local space)

  • iModel 社区 Hub(Community Hub)挂载点(如果已配置)

在入口页,你还可以新建工作流(点击 “+” 按钮),或通过 Hub 登录以访问远程空间。

工作流编辑器 & 节点(Workflow Editor & Nodes)

工作流编辑器是你搭建工作流的地方。工作流由一个个节点(nodes)组成,每个节点代表一个任务。

  • 创建新工作流:可以在空间浏览器里选择 “Create workflow”,给它命名后点击 “Create”;也可以通过工作流标签栏的 “+” 建一个空白流程。

  • 添加节点:可以从节点库(Node Repository)中拖拽到画布上;也可以通过 “快速节点添加面板(Quick Node Adding Panel)” 双击画布打开推荐节点面板;将兼容的节点拖进来。

  • 连接节点:把一个节点的输出端口(output port)拖到另一个节点的输入端口(input port)即可连接。对于某些节点,你可以点击 “+” 来添加动态端口。

节点基本信息

  • 节点在画布上是一个带有输入/输出端口的小方框。

  • 端口类型可以多样(例如数据表、模型等),连接时必须类型匹配。

  • 节点状态通过 “红、黄、绿” 灯(traffic light)显示:

    • 红:未配置(not configured)

    • 黄:已配置(configured)

    • 绿:已执行(executed)

你可以通过节点的上下文菜单(右键)或操作栏来配置、执行、取消或重置节点。重置操作会将节点及其后续节点的状态清除(输出也被清除)。

节点端口(Ports)

节点可以有多个输入/输出端口。数据从某个节点的输出端口传到另一个节点的输入端口。除了普通数据(如数据表)之外,端口还可以处理模型、数据库查询等不同类型。

如果某些输入端口是可选的(optional),它们在 UI 上可能是空的,这代表该输入可以为空。如果是必需端口(mandatory),必须连接才能执行节点。

添加节点方式总结

  1. 从节点库拖拽节点到画布

  2. 双击节点库中的节点

  3. 使用快速节点添加面板(Quick Node Adding Panel):双击画布或拖一个端口到画布,会出现推荐节点。

使用推荐面板时,如果你愿意允许匿名使用数据,可以在启动或切换工作区时同意 “帮助改进 iModel” 对话框。你也可以在偏好设置(Preferences)里关闭社区节点推荐。

节点替换、复制和注释

  • 移动和复制:节点可以拖动移动,要复制的话,选中后右键 Copy,然后在目标工作流粘贴。

  • 替换节点:把一个新节点拖到已有节点上,会出现替换标志。释放鼠标即可替换。

  • 注释 / 标注

    • 节点标签(Node Label):双击节点底下文本框来为单个节点添加注释。

    • 工作流注释(Workflow Annotation):右键画布,选择 “New workflow annotation” 添加注释框。你还能通过注释模式(按 T 键,或点击界面上的注释图标)进入编辑。

    • 注释框文本支持简单标记语法(heading, bullet list, 编号列表等)。

连接 iModel Hub(Connect to Hub)

默认情况下,你可以通过 “Home” 页签连接到你的 iModel 社区 Hub(Community Hub)。

如果你有其他 Hub 实例(例如企业 Hub),可以通过 “Preferences → iModel Explorer → New …” 来添加新的 Hub URL。添加后,在 Home 页签就可以选择这个 Hub 并登录。

登录后,在空间浏览器(Space Explorer)里可以看到该空间里的工作流、组件等内容。

切换到经典界面(Classic UI)

你可以通过菜单在现代 UI(Modern UI)和经典 UI 之间切换:

  • 在现代 UI 中选 “Switch to classic user interface”。

  • 在经典 UI 中点击 “Open Modern UI” 可以回到现代界面。

注意:工作流元素(比如连接器、注释)在两种 UI 中的视觉展现可能略有不同,它们不会完全一样。

空间浏览器(Space Explorer)

空间浏览器是管理你的工作流、文件、组件、文件夹等内容的地方,无论是本地空间还是远程 Hub。

你的空间可以是:

  • 本地工作区(workspace)

  • iModel 社区 Hub 的用户空间

  • 团队空间(如果有团队 Hub)

你可以在空间浏览器顶部选择不同空间。空间浏览器里可以创建新工作流、新文件夹、导入工作流、上传/下载、重命名、删除等操作。将一个文件拖放到画布时,iModel 会自动创建相应的文件读取节点并预配置它。

从 iModel Hub 打开工作流

你可以从 Hub 拖拽工作流到 iModel Analytics Studio 中以打开它。具体方法:

  1. 登录到你的 Hub 实例

  2. 找到你想要打开的工作流

  3. 拖拽该工作流(或其 URL)到 iModel Analytics Studio 界面

  4. 选择某个版本(如果版本管理可用),即可以该版本在本地打开和交互

构建工作流(Building Workflows)

  • 新建工作流后,画布为空。你可以按之前说的方法向其中添加节点。

  • 推荐节点(Workflow Coach):在已有节点的输出端口上拖拽可以触发推荐面板,iModel 会给出兼容节点建议。

  • 有些节点支持动态端口(dynamic ports):在悬停时点击 “+” 可以新增端口;支持不同类型端口时,可以选择端口类型。

  • 你还可以在两个节点之间插入节点:把节点从库中拖到连接线上,释放即可插入。

工作流版本管理(Versioning Workflows)

iModel Analytics Studio 支持版本管理(通过 Hub 上传版本):

  • 当你上传工作流到 Hub 空间时,可以创建版本(versions)。

  • 创建版本:打开工作流,点击其名称旁的版本历史图标 → 选择 “Version history” → 在弹出的对话框中点击 “Create version” → 填写名称和描述 → 点击 “Create”。

  • 查看版本历史:在 “Version history” 对话框中可以看到所有版本(包括草稿版本),显示版本名、描述、创建时间、创建人等信息。

  • 展示一个版本:在版本历史里选择某个版本 → 点击 “Show this version” → 该版本会在画布里打开供你查看编辑。

  • 恢复版本:选择一个之前版本 → 点击 “Restore this version” → 系统会提示确认,因为恢复会覆盖当前未保存更改 → 恢复后该版本作为草稿。

  • 删除版本:在版本历史中点击某版本旁的删除图标即可删除该版本。

节点库(Node Repository)

  • 已安装的所有节点会集中在节点库中。

  • 可以从节点库拖节点到画布,或双击节点。

  • 在节点库顶部有搜索栏,你可以输入关键词来查找节点。

  • 节点库可以以三种视图显示:网格(grid)、列表(list)、树(tree)。

节点描述(Node Description)

  • 你可以选中画布上的节点,然后在侧边栏里查看该节点的描述(功能、配置选项、端口类型等)。

  • 也可以在节点库里,将鼠标悬停在节点上然后点击信息图标(info)来打开该节点的描述面板。

工作流描述(Workflow Description)

  • 在侧边栏描述面板里,可以看到当前活动工作流或选中组件的说明。

  • 点击笔图标可以编辑描述,加链接、标签(tags)等。

  • 支持基本格式语法:

    • 无序列表(使用 * )

    • 有序列表(使用 1. )

    • 加粗、斜体、下划线等(Ctrl + b, i, u)

  • 编辑组件(component)描述:需要先打开该组件(右键 → Component → Open component),然后在它自己的画布里编辑描述。

iModel AI 助手(AI Assistant)

iModel 包含一个 AI 助手,帮助回答你的提问、协助构建定制工作流,从而简化数据分析任务。

安全与隐私

  • 在与 AI 助手集成时,iModel 会安全地传输部分数据给通用模型提供方(如 OpenAI 或 Microsoft Azure OpenAI)。

  • 传输内容:用户在助手侧边栏输入的文本,以及在 “构建模式(Build 模式)” 下某些节点表结构(列名、数据类型等)。但实际的数据(如记录值)不会被共享

  • 所用模型

    • 问答模式(Q&A):使用更小型模型(如 GPT-4.1-nano)

    • 构建模式(Build):使用更完整模型(如 GPT-4.1)

  • AI 助手不由 iModel 自身托管,而是直接连接到提供商的 API。

使用方式

  • 登录你的 iModel Hub 帐户后,即可启用 AI 助手。

  • 在偏好设置里(Preferences),你可以选择助手连接到哪个 Hub 实例,以及是否启用 AI 助手。

  • 启用后,AI 助手默认显示在现代 UI 的侧边栏。

  • 进入 AI 助手后,你必须先接受隐私免责声明(disclaimer),确认哪些信息会被共享。

模式

AI 助手有两种模式:

  1. 问答模式(Q&A)

    • 用于提出关于 iModel 功能的问题

    • 回答可能会推荐适合的节点;如果节点已安装,可直接拖入画布;若未安装,会提供 Hub 安装链接

    • 你可以查看答案来源(source),以及相关资源(如工作流、论坛、文档)

    • 能对答案点赞 / 点踩提供反馈

  2. 构建模式(Build)

    • 用于根据你的提示扩展工作流

    • 当前要求从已有节点(已有数据端口)开始构建,不能从空白画布启动

    • 在 “快速节点添加面板” 中可以选择 “Build with K-AI”(即 “与 AI 构建”),然后输入提示语,AI 会建议节点并添加注释

关闭 / 禁用 AI 助手

  • 通过偏好设置:进入 Preferences → Modern UI → AI Assistant,取消勾选 “Enable the AI Assistant”

  • 通过配置文件(iModel.ini):打开 .ini 文件(安装目录下),添加条目:


    -Dorg.knime.ui.feature.ai_assistant=false

    (这里 “knime” 是原名,若你的开源版里也直接用了这个配置名可保留,但可以在文档里注释:这是旧配置项名。)

在 .ini 中的设置优先级高于配置文件或偏好设置。

工作流监控(Workflow Monitor)

  • 在侧边栏导航中可以打开 “Workflow Monitor” 选项卡。

  • 这个界面用于查看工作流执行中出现的错误和警告。

  • 当节点出错或警告时,你可以点击对应图标,界面会自动跳转到出问题的节点(如果它在组件/元节点里,也会定位到相应层级)。

节点监视器(Node Monitor)

  • 节点监视器面板通常在界面下方。

  • 可用于查看中间输出,比如某个端口的数据预览(Preview)或流变量(Flow Variables)。

  • 切换到 “Statistics” 视图可以看到数据的基本统计信息。

  • 支持将表或统计视图分离出来,在单独窗口中查看(点击对应的图标)。

小地图(Minimap)

  • 在工作流编辑器的右下角有一个小地图,显示整个工作流的鸟瞰图。

  • 当前视图用矩形高亮表示。

  • 你可以拖动这个矩形快速导航到画布上其他区域。

  • 还可以调整缩放(zoom)、平移(pan)或隐藏小地图。

帮助(Help)

通过点击界面右上角的 “Help” 按钮,你可以访问:

  • 键盘快捷键(Keyboard shortcuts)

  • 学习资源(如速查表、快速入门指南、文档)

  • 社区论坛(Community Forum)

  • 关于页面(About):显示当前 iModel Analytics Studio 版本、安装细节等

  • 开源软件组件版权信息等

管理工作流状态与日志(Managing Workflow States & Logs)

节点重置 & 工作流执行

  • 当你重置节点时,该节点及其后续节点会从 “已执行(executed)” 状态变回 “已配置(configured)”,其输出结果将被清除。

  • 如果你保存处于已执行状态的工作流,输出数据也会一起保存。这可能导致大型数据集生成非常大的工作流文件。

  • 因此,建议在保存之前重置工作流(如果数据可以重新获取),这样只保存节点配置,而不保存中间结果。

iModel 日志 & 节点操作

  • iModel 会将所有节点操作(创建、配置、执行)记录在日志中。

  • 日志文件 imodel.log(原为 knime.log)保存在工作区的 .metadata/imodel/ 目录中。

  • 在经典 UI 中,可以通过 “View → Open log” 来查看日志。

日志记录目标(Logging Targets)

iModel 支持多种日志输出目标:

  • 全局日志文件 imodel.log(记录平台和节点事件)

  • 每工作流单独日志文件

  • 平台日志(如 Eclipse 底层事件)

  • 标准输出/错误(Terminal)

  • 控制台视图(Console view in GUI)

日志文件有最大大小限制,满了会轮转(rotate)压缩归档。

默认日志级别 (logging level) 可配置为 DEBUG, INFO, WARN, ERROR, OFF。

修改日志级别

  • 进入 Preferences → iModel(原 KNIME)中可以调整日志级别。

  • 你也可以启用/禁用每工作流日志。

  • 如果希望把全局消息也写入每流程日志,可以在偏好设置中打开对应选项。

配置来源优先级

日志配置可能来自多个地方,优先级如下(低到高):

  1. 默认 Log4j 配置(项目工作区目录)

  2. 内建默认设置

  3. 自定义配置文件(如 .epf,可通过 Hub 分发)

  4. 用户在偏好设置里设置

配置 iModel Analytics Studio

偏好设置(Preferences)

  • 通过界面右上角打开 Preferences。

  • 常见子类包括:数据库驱动、更新站点 (update sites)、界面外观等。

  • 网络连接 (Network Connections):可以配置代理(proxy)、手动 / 直接 / 本地(native)提供商。

  • 代理认证 (Proxy Authentication):支持基本用户名/密码认证,凭证存储在安全存储 (Secure Storage) 中。

  • 排除某些主机不走代理(Proxy Exclusion):可以使用通配符 (*) 排除 host。

iModel 配置

  • 在 “iModel” 子项中,你可以定义日志级别、节点线程数 (最大线程数) 以及临时文件夹路径。

  • 你还可以选择是否同意 “帮助改进 iModel”(匿名发送使用数据),这会启用节点推荐功能。

界面 (Modern UI) 配置

  • 在 “Modern UI” 子项里,你能选择:

    • 要在节点库 / 推荐里包含哪些节点

    • 鼠标滚轮操作对应行为

    • 切换 UI 类型时是否提示关闭项目

    • 节点配置对话框显示方式(内嵌 / 新窗口)

    • AI 助手连接到哪个 Hub,以及是否启用 AI 助手

经典 UI 设置

  • 在经典 UI 子项里,可以设置控制台视图日志级别(默认 WARN),以及是否显示确认对话框(比如重置节点、删除节点等)。

  • 你还可以配置在某些操作之前是否自动执行前置节点(如保存、加载旧版等)。

表格后端 (Table Backend)

  • 从版本 v4.3 开始,iModel 引入了 列式后端 (Columnar Backend),基于 Apache Arrow,可优化内存使用。

  • 你可以为单个工作流设置后端类型:在描述 (Description) 面板里打开工作流配置 → “Table Backend” 标签 → 选择列式 (Columnar) 或传统后端。

  • 你也可以设置默认后端:在 Preferences → Table Backend 中选择列式后端作为默认。

  • 列式后端还有缓存参数可调节(off-heap 缓存)。调整时要注意不要超出物理内存,否则可能不稳定或崩溃。

  • 在 Linux 上,如果使用列式后端可能会出现高内存占用问题,这是因为 JVM 与 glibc 本地内存分配器 (malloc) 交互不优。一个常用的 workaround 是设置环境变量 MALLOC_ARENA_MAX=1。

设置 imodel.ini (原 knime.ini)

  • 安装 iModel Analytics Studio 后,会有一个 imodel.ini(或仍以 knime.ini 命名,如果未改)配置文件,位于安装目录中。

  • 你可以使用文本编辑器打开并修改它(例如调整内存、系统属性等)。

  • -Xmx 参数控制 JVM 最大堆内存(例如 -Xmx8G 表示 8 GB)。推荐值为系统内存的一半左右。

  • 常用设置示例:

    • 压缩算法(-Dimodel.compress.io 原 knime.compress.io):如 SNAPPY、GZIP、NONE

    • 小表 (small table) 缓存大小(-Dorg.imodel.container.cellsinmemory)

    • 缓存策略 (-Dimodel.table.cache:LRU 或 SMALL)

    • URL 超时参数(-Dimodel.url.connectTimeout、-Dimodel.url.readTimeout)

    • 是否阻止 Chromium 外部请求(-Dchromium.block_all_external_requests)

    • Python 证书 (cacerts) 来源(-Dimodel.python.cacerts)

运行时选项(Runtime Options)

  • iModel 基于 Eclipse,因此支持 Eclipse 的运行时参数。

  • 你可以在命令行启动时传递参数,也可以把它们写在 imodel.ini 文件中。

  • 命令行参数必须写在 -vmargs 之前(如果在 .ini 中配置)。

  • 对于头 less(无 GUI)运行(例如批量执行 / container 部署),也支持相应的命令行参数。