📰 最近消息
Binding Language Models in Symbolic Languageshttps://lm-code-binder.github.io/ICLR23 top-25% 终于也开始实际地评估LLM转换形式语言的效果了
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Modelshttps://testtimescaling.github.io/主要是这图整挺好(另附一篇相似目标的综述,称为长CoThttps://long-cot.github.io/个人感觉这两篇只可以作为检索工具使用,或者帮新入学研究生建立低分辨率地图。推理发展内驱力还并不能完整地被这个分类学刻画,在机理解释性不足的现在也没有条件做理论家的工作,有那功夫直接做研究文章了(
Channel name was changed to «Vintage NLP for Work»
Theory of Deep Learning ( Sanjeev Arora ). 2022
惭愧第一次看到 hinton, 1986,整理下可能至少留意如下几种“分布的”的语源:- distributional semantics/hypothesis/representation (Harris, 1956): 指用语料中分布情况来定义成“语义”,在当时可能希望把“分布”数学化但其实还是挺语言学的- distributed representation(Hinton, 1986): 指特征并非是组织好的而是像神经元一样散落地在各处激活而无论如何我们都可以用更数学(至少更概率统计)的方式来描述更当代的 representation了,上述语源可能也从 word2vec 开始合流,不再