stylegan Ubuntu env setup

发布时间:2024-03-02  栏目:AI应用领域, GPU, VideoConference, 人工智能, 元宇宙, 图像处理, 机器视觉  评论:0 Comments

Check the python, pytorch and Ubuntu version in conda env: python –version conda list pytorch lsb_release -a gcc –version 看CUDA版本的方法有多种,通过命令行查看。打开命令提示符(CMD),输入`nvcc -V`或`nvcc –v...

处理时间与延迟时间

发布时间:2023-10-19  栏目:ADAS, AI应用领域, VideoConference, 元宇宙, 图像处理, 机器视觉, 模型加速或优化  评论:0 Comments

在自动驾驶辅助驾驶的视觉感知,以及视频通讯特效领域都有碰到这两个概念的区分。   在视频通讯的特效领域要区分处理时间与延迟时间: – 每一个视频处理模块的处理时间要达到实时,一般需要保持在30ms以内,如果大于这个值,就需要掉...

Textual Inversion vs. Dreambooth

发布时间:2023-03-01  栏目:AI应用领域, 人工智能, 元宇宙, 图像处理, 机器视觉  评论:0 Comments

Textual Inversion 从 SD 已知的内容中挖掘给定的输入。Dreambooth 将所需内容插入到输出中。那么在实践中有什么区别呢? Textual Inversion 不会在系统中插入“新数据”,它只提供更好的向导以便找到所需内容。Dreambooth 需要插入且只插入所需的...

AI videos

发布时间:2023-02-22  栏目:AI应用领域, 人工智能, 元宇宙, 图像处理, 机器视觉, 深度学习  评论:0 Comments

Gen-1 by Runway (runwayml.com)

关于ChatGPT的一点初步思考

发布时间:2023-01-29  栏目:AI应用领域, VideoConference, 人工智能, 元宇宙, 智能问答, 机器人, 深度学习, 自然语言处理  评论:0 Comments

深度学习应该是有很多瓶颈的,那么为啥ChatGPT可以是实现类似于质的飞跃?真的只是因为它有比较大的量和做了表面的优化(强化学习)这个吗?   个人初步感觉,words可能比图像输入有更强的condition和context信息,特别是如果融合前后3000...

ChatGPT Related Papers

发布时间:2023-01-27  栏目:AI应用领域, 人工智能, 元宇宙, 智能问答, 深度学习  评论:0 Comments

InstructGPT: [2203.02155] Training language models to follow instructions with human feedback (arxiv.org)   reinforcement learning from human feedback (RLHF)

一些较新的参考论文

发布时间:2023-01-23  栏目:AI应用领域, VideoConference, 人工智能, 元宇宙, 智能问答  评论:0 Comments

Stable Diffusion One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing Hong_Depth-Aware_Generative_Adversarial_CVPR_2022_supplemental DDIM Dream Booth  

Windows程序性能分析及改善工具

发布时间:2023-01-18  栏目:AI应用领域, C++, VideoConference, 元宇宙, 工程部署, 软件、框架及系统  评论:0 Comments

Windows Performance Analyzer | Microsoft Learn

教会AI进行数学推理

发布时间:2023-01-16  栏目:AI应用领域, 人工智能, 元宇宙  评论:0 Comments

Teaching AI advanced mathematical reasoning (facebook.com)

视频质量客观评价指标

发布时间:2023-01-05  栏目:VideoConference, 元宇宙, 图像处理, 机器视觉, 深度学习  评论:0 Comments

PSNR SSIM VMAF

一句话生成3D模型

发布时间:2022-11-27  栏目:AI应用领域, 人工智能, 元宇宙, 图像处理, 机器人, 机器视觉, 深度学习  评论:0 Comments

英伟达“一句话生成3D模型”碾压谷歌:分辨率清晰8倍,速度快2倍 (qq.com)

Create videos from plain text in minutes as virtual support agents

发布时间:2022-11-09  栏目:AI应用领域, 人工智能, 元宇宙, 智能问答, 机器人  评论:0 Comments

Synthesia | #1 AI Video Generation Platform

Introducing AI-driven acoustic synthesis for AR and VR【转】

发布时间:2022-07-04  栏目:AI应用领域, 元宇宙, 图像处理, 机器视觉, 深度学习, 自然语言处理  评论:0 Comments

Introducing AI-driven acoustic synthesis for AR and VR (facebook.com)

相册集

pix pix pix pix pix pix

关于自己

杨文龙,微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位,热爱创新发明,专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域,目前发明有国际专利19篇,中国专利28篇。

联系我

个人技术笔记

290125097@qq.com

2015 in Shanghai