在人们谈论ChatGPT和生成式AI之前,像Datasaur这样的公司就已经在处理构建机器学习模型的细节,帮助标记数据以训练模型。随着人工智能的兴起,这种能力变得更加重要。

为了让更多的公司能够在没有数据科学专家的情况下构建模型,Datasaur宣布可以直接从标记数据中创建模型,使模型创建对于技术水平较低的用户也成为可能。该公司还宣布在去年12月完成了400万美元的种子轮融资延期。

公司创始人Ivan Lee表示,AI兴趣的最近激增对公司来说是一件好事,实际上也符合该初创公司的战略。“Datasaur一直致力于成为您收集培训数据的最佳平台,无论您是用于LLMs、传统NER模型、情感分析或其他用途。” Lee告诉TechCrunch。

“我们只是非技术用户的最佳界面,让他们来标记这些数据,”他说。

LLMs的兴起有助于提高人们对于AI在商业环境中的意识,但他表示大多数公司仍然处于探索阶段,仍然需要像Datasaur这样的产品来构建模型。 Lee表示,他从一开始的目标之一就是使AI民主化,特别是在自然语言处理领域,并且新的模型构建功能应该使更多的公司(甚至那些没有专业知识的公司)可以使用AI。

“我对这个功能特别兴奋,因为它允许没有数据科学家,没有工程师的团队根据他们自己的需求对数据进行标记,它会自动为他们训练一个模型,”Lee说。

Lee将其视为超越数据科学家初始目标市场的方式。“现在我们将开放给建筑公司、律师事务所、市场营销公司等没有数据工程背景的团队,但仍然可以根据他们的训练数据构建NLP模型。”

他表示,他能够限制自己的风险投资金额,因为他运营得非常精简。他的工程团队大部分位于印度尼西亚,虽然他预计会继续招聘,但他为公司的高效运营感到自豪。

“我的理念一直是盈利,以可扩展的方式发展,绝不是不惜一切代价地增长,”Lee说。这意味着他对每一位员工的考虑,以及员工对业务的影响。

通过拥有一个远程、跨文化的员工队伍,员工可以互相学习,这使得公司本质上拥有了多样性。“在美国和印度尼西亚的工作场所文化之间存在显著差异。因此,我们必须有意识地捕捉两者最好的一面,”他说。这可能意味着鼓励印尼尼西亚同事发表意见,或对经理说不,这在文化上是不愿意的。“我们在鼓励这一点方面一直非常积极,”他说。

但他说,美国员工也可以学到许多关于亚洲的运作方式,例如尊重同事和将团队放在第一位的文化,他必须帮助团队解决这些文化差异。

这400万美元的投资由Initialized Capital领投,HNVR、Gold House Ventures和TenOneTen参与。该公司总共筹集了790万美元。

文章来源:TechCrunch

Logo

让我们一起发现每天值得关注的IT世界!

更多推荐