The World’s Largest Multimodal Dataset | Episode 1

The formula for AI datasets

Frederik, Head of Machine Learning at Encord, introduces the world's largest multimodal AI dataset. This dataset is designed to foster the development of models that fuse many modalities, similar to the well-known CLIP model - the ignition for new AI applications requiring more than just single modalities. In this episode, Frederik explains the formula they used to build the dataset, divided into three stages: pre-training, high-quality post-training, and a quality evaluation set.

Speakers

Frederik Hvilshøj

ML Lead @ Encord

The World's Largest Multimodal AI Dataset

The open-source E-MM1 dataset has 100+ million groups of images, videos, text, audio and 3D point clouds, giving AI teams more training data for their AI models.

Multimodal Dataset E-MM1

The World’s Largest Multimodal Dataset | Episode 1

The formula for AI datasets

The World’s Largest Multimodal Dataset | Episode 2

Pre-training 107 million AI data groups

The World’s Largest Multimodal Dataset | Episode 3

Post-training 1 million AI data annotations

The World’s Largest Multimodal Dataset | Episode 4

Consensus-based evaluation in AI datasets

The World’s Largest Multimodal Dataset | Episode 5

The formula for AI datasets

Speakers

Frederik Hvilshøj

The World's Largest Multimodal AI Dataset

Multimodal Dataset E-MM1

The formula for AI datasets

Pre-training 107 million AI data groups

Post-training 1 million AI data annotations

Consensus-based evaluation in AI datasets

Building the next CLIP model with E-MM1

Subscribe to our newsletter

Platform

Learn

Company