本地部署DeepSeek大语言模型需要安装Ollama、Open WebUI和Docker，步骤包括下载模型、启动服务器、访问Web界面并注册账号。支持的模型可通过Ollama库和Hugging Face等平台获取，硬件要求为CPU 8核、内存16GB及显卡8GB以上。

如何本地部署DeepSeek这类大语言模型？

本文介绍了如何使用ngrok远程访问本地部署的Dify，包括安装chocolatey和ngrok、配置ngrok密钥以及通过ngrok部署应用。注意事项包括免费版ngrok生成的URL是临时的，使用时需注意安全问题。文中还提供了常见问题解答，指出ngrok不支持在命令行中直接指定完整的URL路径。

如何远程访问本地部署的Dify

Dify的可视化编排功能与建筑设计软件Rhino及其插件Grasshopper相似，旨在简化AI应用开发。Dify的核心组件“节点”与GH的“运算器”相对应，均不要求用户具备编程基础，但需良好的逻辑思维。Dify的“工具”节点功能的Workflows与GH的“电池组”类似，电池图复杂度一般反映了用户对工具的熟练度。通过这种可视化方式，用户能够更容易理解技术概念，进而高效解决复杂问题。

聊聊Dify的可视化编排

该文档是我借助LLM制作脚本的过程记录。脚本是主要通过Selenium和Chrome开发者工具实现截图，Cloudinary作为外部图像服务，实现自动化批量网页。还包括错误处理、日志记录、跳过问题URL的功能，并在失败时继续处理其他URL。并提到了常见问题及其解决方案，如弹窗警告和Notion API连接限制，文末有代码的GitHub链接。

如何用自然语言构建将网页自动批量截图至Notion的脚本

创建了一个基于Notion的导航站，以提高查找和管理AIGC资源的效率，提供一个集中且全面的学习平台。核心功能包括收集和组织学习资源，并利用Notion AI提炼AI产品功能，目标用户为对AIGC感兴趣的学习者和希望提升生产效率的非技术人员。

我用Notion做了个AI相关的导航站

通过将 GitHub 与 Notion 集成，可以更有效地管理和检索 GitHub Star 的仓库。本教程包括如何获取 Notion 数据库 ID、Notion API 密钥和 GitHub 个人访问令牌，并设置环境密钥。用户可以启用 GitHub Actions 实现全量或增量同步，此外，Notion AI 可用于自动总结仓库内容以提高检索效率。

Manage your GitHub Repo stars  with Notion

第二次约小红书搭子户外，这次是群友调动并挑选的风水宝地，虽然那位群友临时有事情撞上了，原本12人参与接龙，最后是8人同行。运气不错赶上好天气，徒步的时候会有凉风，晴天下拍照光影绝佳。

香港城门水塘徒步

Udio v1.5展示了8个音乐创作和混音的示例，包括作品如"Andreh P."的"Break My Leg"和"The I Don't Knows"的"Summer of '88"。此外，更新了音频质量和功能，包括词干下载和音频转音频。

Udio v1.5 创作音乐和混音的8个示例

FLUX.1是由Black Forest Team发布的开源图像生成器，性能媲美Midjourney V6，分为Pro（闭源）、Dev（开源但不可商用）和Schnell（开源可商用）三个版本。该模型在图像生成方面表现出色，用户反馈显示其在文本和解剖结构上优于Midjourney，且生成成本低。官方网站和多个合作平台提供了访问和使用FLUX.1的资源。

媲美Midjourney的开源项目FLUX.1详情和示例

ChatGPT高级语音模式包含16个示例，如中文对话、实时日语翻译、法语学习、不同语言的故事朗诵、英语发音纠正、动物声音模仿、诗歌朗读、歌曲演唱、情感表达、创意叙述等。该模式首先向部分ChatGPT Plus用户推出。

ChatGPT 高级语音模式16个示例

制作AI音乐视频的工作流程包括将《华尔街日报》的内容输入Claude生成场景描述，使用图像生成AI创建图像并转化为视频片段，创作歌词和生成配乐，最后在iMovie中组合所有元素。

用当天的头条新闻制作一个AI音乐视频

Midjourney 6.1发布后，用户利用Gen-3和Luma AI创造了许多惊艳的图像和视频，尽管动态图像的准确性有所下降，但渲染效果有所提升，整体展现了显著的进步和演变。文中列举了10个示例，展示了不同应用场景和效果的对比。

Midjourney 6.1 10个示例

使用SearchGPT的体验总结：优点包括快速响应、易于访问的来源、良好的答案展示和后续问题处理；缺点是图片搜索不准确和事务性搜索能力不足。总体而言，SearchGPT是一个优秀的原型，但尚未成为一个全面的搜索引擎。

SearchGPT 原型实测

Gemini 1.5 Pro（实验版0801）在Chatbot Arena测试中以1300分超越GPT-4o和Claude-3.5，首次登顶，表现出色，尤其在多语言任务和数学领域。总排名第一，显示出强大的多语言能力，但在编码和硬提示等技术领域仍落后于其他模型。

Gemini 1.5 Pro 综合测试成绩超越 GPT-4o

在大多数基准测试中，llama 3.1优于gpt-4o，本文从9.11和9.9比大小、Linkedin标题生成、商业计划、冷邮件和Linkedin邀请函这5个测试对比分析。llama 3.1是一个令人印象深刻的开源项目，有时甚至优于gpt-4o。开源AI将主导未来，闭源AI可能会逐渐消失。

Llama 3.1 vs GPT-4o

Mistral 发布了 Large 123B 模型，该模型支持 11 种语言，上下文大小为 128K，并经过 80 多种编程语言的训练。 它的性能与 Meta Llama 405B 模型类似，并具有强大的编程能力。 该模型与 Transformers 框架集成，需要大量的 VRAM 供 GPU 使用。

Mistral Large 123B很接近Meta Llama 405B的能力，甚至编程更强

讨论AI Agent的演变及其在人工智能系统变革中的关键作用。从单一模型到复合人工智能系统，探索人工智能代理如何与数据库和外部工具集成，以增强解决问题的能力和适应性。

AI Agent 是什么？

用Claude Artifact轻松创作这些游戏：3D魔方模拟、火箭发射器游戏、拼图益智游戏、Puyo游戏、烟花制作器、文字云生成器、俄罗斯方块、Flappy Chicken游戏和解除封锁游戏。

Claude Artifact 10个创作实例

使用Cloudinary、GitHub和Vercel搭建个人图库网站。

搭建个人图库网站 - Vercel Image Gallery Starter

对目前住宅形势的大概理解：施工工期一两年完工交房，房子使用年限可能少于50年，产权问题包括土地使用权和房屋所有权，土地使用权为70年，房屋所有权是永久的。安全问题涉及设计使用年限和房屋保养，设计使用年限一般为50年，物业规则影响房屋保养的效率和质量。

对目前住宅形势的大概理解

ComfyUI的安装与部署、界面介绍、文生图/图生图、ControlNet使用、Upscale

分享一个ComfyUI快速入门教程

对AI赛道的思考表明，外行与从业者对人工智能的看法截然不同。外行认为AI能力有限，缺乏实际应用，而从业者则看到其在生产力提升中的潜力。尽管目前存在鸿沟，随着技术发展，AI将更好地服务普通用户。学习AI理论和应用可以显著提高个人效率。

我为什么选择AI赛道？

该开源项目能实现内容创作的多平台同步，可支持平台覆盖国内主流自媒体！

分享一个自媒体多平台同步开源项目

ComfyUI是一个开源的、基于Web的Stable Diffusion模型界面，为文本到图像的AI生成模型提供用户友好的定制工作流程和生产力优化，支持高级功能集成和自动化任务，适用于寻求灵活高效图像生成解决方案的创意专业人士。

ComfyUI是什么？

最近听了一个干货播客，叫《对谈王梦珂：每个人都值得尝试来做小红书》。为什么值得尝试做小红书？从对话王梦珂中，我总结出八点小红书运营心得。

王梦珂建议人人都值得尝试做小红书

包括写作来克服过度思考，阅读来找到灵感，冒险来克服胆怯，走走来摆脱停滞，睡觉来缓解疲惫，提问来解决困惑，动起来来缓解焦虑，休息一天来克服倦怠，检讨进度来克服无动于衷，记住自己的"为什么"来找到动力。

如何保持冷静？

在户外徒步时，拍了一些果子的照片给GPT-4o，希望它能判断果子的品质。然而，园林专业的同学指出了GPT-4o的错误。人工智能还有很长的发展路程，但仍然对其抱有希望。

这算不算GPT-4o翻车了？

如果你想参与人工智能的发展，可以通过体验不同的LLM、建立一个AI agent、了解LLM和AI的能力边界、创建一个简单的RAG系统以及微调一个LLM来快速掌握人工智能知识。进行实验，开始动手，很快每个人都能创建AI agent。

如何参与人工智能的发展？

包括AI伦理专家、AI维护技术员、AI集成专家等。这些角色旨在确保AI技术被有效、负责任地实施和使用，创造新的就业机会。

GPT-4o取代部分职业的同时，又创造了哪些新的工作岗位？

月之暗面的 Kimi Chat 终于憋不住要向用户收费了，推出了6种打赏方式。从商业模式、打赏机制、现状问题聊聊产品思考。

聊下关于Kimi推出的打赏机制的产品思考

分享几种简单且美观的编辑截图的工具

如何让截图变的更吸引人？

几个小伙伴一起去香港东平洲，感受无人机视角下的“千里江山图”

香港东平洲徒步攻略

OpenAI宣布GPT-4免费，新模型GPT-4o实现实时文字及视频交互，相比GPT-4-turbo，价格变一半，速度变两倍，编程能力极大提升。

OpenAI 刚刚宣布了 ChatGPT 的新实时对话聊天功能 | GPT-4o

PARA理论进行知识库及项目管理，按事件的活跃程度进行分类

How to make a PARA system?

Free and easy way with no code to build a blog. 无代码建立博客，免费且简单。Notion Site / NotionNext / Gmeek / Xlog 

How to build a blog

学习产品经理的定义是指洞察特定人群在特定场景下的需求，提供需求解决方案，并实现产品商业化最大值的人。产品经理的分类包括产品维度和公司维度，成员包括产品经理、UE设计师、UI设计师、开发、测试、运营、用户研究员、数据分析师、商业分析师、项目经理。工作流程包括需求分析、产品设计、产品研发和运营迭代。

学习产品经理② 定义|分类|成员|工作流程

关于产品经理学习的记录，参考资料来自一些产品经理的分享和网上资源。

产品经理学习记录① 知识大纲

如何安排时间学习产品经理知识。建议按照优先级分配时间给各个环节，并通过具体项目进行巩固。强调完成比完美更重要。

这样安排时间学习产品经理知识

赵长鹏的教育革命-Giggle Academy是一个公益性、游戏化、适应性的教学模式。还提到了另一个游戏化教育平台CajunKoi Academy和马斯克的实验性在线学校Astra Nova。

赵长鹏的教育革命-Giggle Academy 

我不再为ChatGPT Plus和Claude 3支付20美元。全球免费访问ChatGPT-4、Claude-3和Midjourney。具体请参考提供的链接和视频。

我不再为 ChatGPT Plus 和 Claude 3 支付 20 美元。

Efficiency

Self-media

Product  Manager

Travel

Growth

Other

The document describes a published menu item titled "Home," with a number of 10000, created on May 6, 2024, and published on May 10, 2024. It includes a summary in Chinese ("首页") and an icon designation.

Home

The document is an archive menu published on May 10, 2024, with the number 10000 and a summary labeled "归档." It includes an icon and was created on May 6, 2024.

About

The document outlines a published menu titled "友情链接" (Links) with the number 10000, created on May 6, 2024, and published on May 10, 2024.

Links

The document details a published menu item for coffee, created on May 13, 2024, with a status of "Published" and a summary labeled "赞赏" (appreciation).

Coffee

Github

Buy me a coffee

使用Cloudinary、GitHub和Vercel搭建个人图库网站，步骤包括注册Cloudinary、Fork GitHub项目并在Vercel上部署，最后修改信息和绑定自定义域名。提供了官方和个人示例作为参考。

Gallery

Vercel

Cloudinary

该开源项目支持自媒体内容在多个平台之间同步，包括从知乎、头条等同步到公众号，提供便捷的内容发布和管理功能。

Sync

ComfyUI是一个开源的Web界面，优化了Stable Diffusion的工作流程，提供模块化设计和图形界面，支持图像生成、修复和高级功能集成，适合创意专业人士使用。用户需熟悉相关AI概念以充分利用其灵活性和可定制性。

Stable Diffution

ComfyUI

通过对话王梦珂，总结出小红书运营的八大心得，包括平台优势、适合人群、内容创作技巧和可持续发展建议，鼓励每个人尝试在小红书上创作内容。

Operating

保持冷静的建议包括：写作以克服过度思考，阅读以寻找灵感，冒险以克服胆怯，走动以摆脱停滞，睡觉以缓解疲惫，提问以解决困惑，运动以减轻焦虑，休息以克服倦怠，检讨进度以激励自己，记住自己的“为什么”以找到动力。

在户外徒步时拍摄果子照片给GPT-4o判断，结果被园林专业的同学指出错误，显示人工智能仍需发展，但仍对其未来抱有希望。

GPT4o

Mistral发布的Large 123B模型支持11种语言，具有128K上下文和强大的编程能力，其性能接近Meta Llama 405B模型。MMLU得分为84.0%，HumanEval编程得分为92%，GSM8K数学问题解决得分为93%。该模型集成于Transformers框架，需大量VRAM供GPU使用。

Mistral

Meta Llama

公告编号10000已发布，日期为2024年5月11日。如加载有误，可前往Notion Blog阅读。

Product Manager, Designer. Focus on Product, AI.

Kinpoe.Ray

Due Date

Status

Date

author

content

featured_image

views

comments

is_published

related_posts

rating

is_featured

published_date

password

icon

Number

date

type

slug

status

Created

title

summary

AI summary

Setting

Published

Notice

在大多数基准测试中，Llama 3.1 优于 GPT-4o，特别是在 LinkedIn 标题生成、商业计划和邀请函方面表现突出。尽管在 9.11 和 9.9 测试中 GPT-4o 表现更好，但整体来看，Llama 3.1 被视为开源的胜利，未来开源 AI 可能会主导市场。

Gemini 1.5 Pro（实验版0801）在Chatbot Arena测试中以1300分超越GPT-4o和Claude-3.5，首次登顶，特别在多语言任务和数学领域表现出色，但在编码和硬提示等技术领域仍落后于其他模型。

Google Gemini

产品经理、设计师，关注产品、人工智能。

Product Manager, Designer,

Focus on Product, AI.