LLM Agent(3) - ToolUse
Published:
组件三:工具调用
Tool use is a remarkable and distinguishing characteristic of human beings. We create, modify and utilize external objects to do things that go beyond our physical and cognitive limits.
Published:
Tool use is a remarkable and distinguishing characteristic of human beings. We create, modify and utilize external objects to do things that go beyond our physical and cognitive limits.
Published:
这里的记忆是指负责获取,存储,保存和检索信息的进程。如果把代理中的记忆和人类记忆相比较的话:
Published:
本文介绍了由大语言模型驱动的自动代理的原理,在大预言模型越来越流行和日渐强大的今天,使用大预言模型不仅可以进行文书,编码上的一些辅助,更可以成为一个通用的自主问题解决器,比如作为自动代理的驱动。
Published:
Mythril 是 EVM 字节码的安全分析工具。它可以检测为以太坊、Hedera、Quorum、Vechain、Roostock、Tron 和其他 EVM 兼容区块链构建的智能合约中的安全漏洞。它使用符号执行、SMT 解决和污点分析来检测各种安全漏洞。
Published:
对于一个协议,我们定义通讯双方为Alice和Bob,这三种一致性都有一个统一的前提,即 **Alice和Bob成功完成了一轮通讯,同时Alice作为通讯的发起者,ta单方面的认为ta在和Bob进行通讯,同时存在一个变量集𝟇,其中所有元素均为Alice和Bob通讯时使用的变量 **。有了该前提后,对于三种一致性分别满足如下的条件:
Published:
Background:
随着物联网设备的普及,其安全性变得愈发受人关注,其中一个重要方面就是固件安全,而fuzzing作为一个有效的漏洞检测技术,在IoT固件的安全测试中扮演着重要角色。但是要将fuzzing应用到IoT固件时,有如下几个问题:
Method:
文章针对如上问题,提出了一种新颖的fuzzing测试工具: FirmHybirdFuzzer。该工具具有如下特点:
Published:
Syzkaller is the most famous kernel fuzzer in this world. It’s developed by Google and is open-source. It has been widely adopted by the kernel community to detect bugs in kernel source code.
Published:
KCOV 以一种适用于覆盖率引导的模糊测试的形式收集和暴露内核代码覆盖率信息。一个正在运行的内核的覆盖率数据可以通过 kcov
调试文件导出。覆盖率的收集是基于任务启用的,因此 KCOV 可以精确捕获单个系统调用的覆盖率。
Published:
该文章探讨了大型语言模型(LLMs)在解决 CTF 方面的有效性。对于两种使用 LLM 解决 CTF 题目的方式:人类参与(HIML)和自动化完成,通过测试其输出结果在技术方面的正确程度进行评估打分。以检验LLMs在解决一组选定的CTF挑战时的能力。他们收集了人类参赛者在同一组问题上的结果,并发现LLMs的成功率高于平均人类参与者。
Published:
文章探讨了语言模型(LMs)在网络安全领域的潜力和挑战,特别是在自动化和增强数字工作方面。随着LMs在计算效率和执行速度方面的显著提升,它们在定位漏洞、执行复杂社会工程和黑客攻击方面可能表现出极高的能力。为了理解和指导LMs在网络安全领域的发展,作者们提出了InterCode-CTF,这是一个新颖的任务环境和基准测试,用于评估语言代理在Capture the Flag(CTF)任务上的表现。作者们手动收集并验证了100个任务实例,这些实例要求使用这些网络安全技能,并在这些实例上评估了当前顶尖的LMs。
Published:
Tool use is a remarkable and distinguishing characteristic of human beings. We create, modify and utilize external objects to do things that go beyond our physical and cognitive limits.
Published:
这里的记忆是指负责获取,存储,保存和检索信息的进程。如果把代理中的记忆和人类记忆相比较的话:
Published:
本文介绍了由大语言模型驱动的自动代理的原理,在大预言模型越来越流行和日渐强大的今天,使用大预言模型不仅可以进行文书,编码上的一些辅助,更可以成为一个通用的自主问题解决器,比如作为自动代理的驱动。
Published:
在编写pass之前,有必要搞清楚LLVM是如何管理pass的。Pass实际上是一个接口,其功能是便利IR并且执行相关的操作,比如Analyze
或者Transform
。要编写一个Pass,具体来说可以分为如下几步:
Published:
When I’m using Syzkaller on our lab’s server, a problem occurs is that our server has no GUI, which means I can not use web broswer to visit the Syzkaller dashboard. That’s quite bothering because I need to check whether Syzkaller find any bugs.
Published:
自从我将MacMini改造为寝室里面的旁路由之后,就一直在想着开发MacMini的新功能,毕竟一个M1芯片在哪,不能只让它干一些网络分流的杂活,于是我突然想到了开源AI绘画的佼佼者 Stable Diffusion,为了色图说干就干。
Published:
关于标题为什么叫Mac Mini拯救计划,是我的Mac Mini在我去年脑袋一热买下之后就没怎么发挥过它该有的生产力(没怎么开过机),自从搬家之后,就一直躺在显示器后面吃灰,终于有一天我觉得不能再这样下去了,好歹也是3000多大洋啊,所以我开始了我的Mac Mini拯救计划,我要一步步榨干MacOS的生产力。
Published:
该文章探讨了大型语言模型(LLMs)在解决 CTF 方面的有效性。对于两种使用 LLM 解决 CTF 题目的方式:人类参与(HIML)和自动化完成,通过测试其输出结果在技术方面的正确程度进行评估打分。以检验LLMs在解决一组选定的CTF挑战时的能力。他们收集了人类参赛者在同一组问题上的结果,并发现LLMs的成功率高于平均人类参与者。
Published:
文章探讨了语言模型(LMs)在网络安全领域的潜力和挑战,特别是在自动化和增强数字工作方面。随着LMs在计算效率和执行速度方面的显著提升,它们在定位漏洞、执行复杂社会工程和黑客攻击方面可能表现出极高的能力。为了理解和指导LMs在网络安全领域的发展,作者们提出了InterCode-CTF,这是一个新颖的任务环境和基准测试,用于评估语言代理在Capture the Flag(CTF)任务上的表现。作者们手动收集并验证了100个任务实例,这些实例要求使用这些网络安全技能,并在这些实例上评估了当前顶尖的LMs。
Published:
Background:
随着物联网设备的普及,其安全性变得愈发受人关注,其中一个重要方面就是固件安全,而fuzzing作为一个有效的漏洞检测技术,在IoT固件的安全测试中扮演着重要角色。但是要将fuzzing应用到IoT固件时,有如下几个问题:
Method:
文章针对如上问题,提出了一种新颖的fuzzing测试工具: FirmHybirdFuzzer。该工具具有如下特点:
Published:
对于一个协议,我们定义通讯双方为Alice和Bob,这三种一致性都有一个统一的前提,即 **Alice和Bob成功完成了一轮通讯,同时Alice作为通讯的发起者,ta单方面的认为ta在和Bob进行通讯,同时存在一个变量集𝟇,其中所有元素均为Alice和Bob通讯时使用的变量 **。有了该前提后,对于三种一致性分别满足如下的条件:
Published:
Mythril 是 EVM 字节码的安全分析工具。它可以检测为以太坊、Hedera、Quorum、Vechain、Roostock、Tron 和其他 EVM 兼容区块链构建的智能合约中的安全漏洞。它使用符号执行、SMT 解决和污点分析来检测各种安全漏洞。
Published:
When I’m using Syzkaller on our lab’s server, a problem occurs is that our server has no GUI, which means I can not use web broswer to visit the Syzkaller dashboard. That’s quite bothering because I need to check whether Syzkaller find any bugs.
Published:
Syzkaller is the most famous kernel fuzzer in this world. It’s developed by Google and is open-source. It has been widely adopted by the kernel community to detect bugs in kernel source code.