Hello, my name is

Yi Chern Tan.

I am a researcher and software engineer with experience in machine learning and natural language processing. I am currently @Cohere. I was previously @Waymo, @Facebook and @Yale. I have published on interpretability, fairness, representation learning and semantic parsing at NeurIPS, ICLR, ACL and EMNLP.

Scholar LinkedIn GitHub Resume

yichern[dot]tan[at]aya[dot]yale[dot]edu

About

I received my BS in Computer Science and Ethics, Politics and Economics from Yale University in 2020. At Yale, I was advised by Dragomir Radev (LILY Lab), Robert Frank (CLAY Lab) and Elisa Celis (Controlling Bias in AI Group). I also worked with John Lafferty to create a curriculum for, and teach, text data science.

My research interests lie in the intersection of language + X ∈ {learning, representation, bias, reasoning} and technology + Y ∈ {ethics, culture, government, security}. In particular, I work on natural language processing and machine learning with the aim of building scalable systems that have a robust understanding of human language, and which are supported both by principled values and elegant engineering.

Apart from research, I also have experience in government and products. At Singapore's Smart Nation and Digital Government Office, I authored strategy papers and analyses on the societal harms of AI and the responsible deployment of human-centered AI systems. At Facebook, I developed transformer-based models for the detection of harmful comments on Instagram and secured the highest tier full-time return offer.

Since my graduation, I've been fulfilling mandatory military service in Singapore, carrying out operations as an "IO" (infantry officer). I am currently a Member of Technical Staff at Cohere, working on large language models.

Skills

Languages

Python
C
JavaScript/Node.js
PHP/Hack
HTML
CSS/Sass
SQL
R
Racket

Frameworks

PyTorch
TensorFlow
Keras
Spark
Hive
React
Flask
Express
ROS

Technologies

Transformers
scikit-learn
nltk
spaCy
AllenNLP
PyText
NumPy
fast.ai
OpenCV
MuJoCo
OpenAI Gym
PostgreSQL
MongoDB

Tools

Git/GitHub
VSCode
Atom
Bash
Colab
Weights & Biases
Tensorboard
Prettier
ESLint
flake8
Emmet

Experience

Cohere

Aug 2022 - present

Command

Member of Technical Staff

Waymo

Mar 2022 - Aug 2022

Simulation

Machine Learning Engineer

Facebook, Inc.

May 2019 - Aug 2019

Instagram

Software Engineering Intern

Yale University

Aug 2018 - May 2019

Data Structures, Algorithms, Text Data Science

Teaching Assistant

TAIGER

Dec 2018 - Jan 2019

NLP

Applied Research Scientist Intern

Smart Nation Office

May 2018 - Aug 2018

Planning and Prioritization Directorate

Policy Research Intern

Publications

*= equal contribution

GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing

Tao Yu, Chien-Sheng Wu, Xi Victoria Lin, Bailin Wang, Yi Chern Tan, Xinyi Yang, Dragomir Radev, Richard Socher, Caiming Xiong

ICLR 2021 (Long Paper)

Paper GitHub Poster

DART: Open-Domain Structured Data Record to Text Generation

Linyong Nan, Dragomir Radev, Rui Zhang, Amrit Rau, Abhinand Sivaprasad, Chiachun Hsieh, Xiangru Tang, Aadit Vyas, Neha Verma, Pranav Krishna, Yangxiaokang Liu, Nadia Irwanto, Jessica Pan, Faiaz Rahman, Ahmad Zaidi, Mutethia Mutuma, Yasin Tarabar, Ankit Gupta, Tao Yu, Yi Chern Tan, Xi Victoria Lin, Caiming Xiong, Richard Socher, Nazneen Fatema Rajani

NAACL 2021 (Long Paper)

Paper GitHub Poster

ESPRIT: Explaining Solutions to Physical Reasoning Tasks

Nazneen Fatema Rajani, Rui Zhang, Yi Chern Tan, Stephan Zheng, Jeremy Weiss, Aadit Vyas, Abhijit Gupta, Caiming Xiong, Richard Socher, Dragomir Radev

ACL 2020 (Long Paper)

Paper GitHub Poster

Assessing Social and Intersectional Biases in Contextualized Word Representations

Yi Chern Tan, L. Elisa Celis

NeurIPS 2019

Spotlight Paper

Paper Code Slides Poster

CoSQL: A Conversational Text-to-SQL Challenge Towards Cross-Domain Natural Language Interfaces to Databases

Tao Yu, Rui Zhang, He Yang Er, Suyi Li, Eric Xue, Bo Pang, Xi Victoria Lin, Yi Chern Tan, Tianze Shi, Zihan Li, Youxuan Jiang, Michihiro Yasunaga, Sungrok Shim, Tao Chen, Alexander Fabbri, Zifan Li, Luyao Chen, Yuwen Zhang, Shreya Dixit, Vincent Zhang, Caiming Xiong, Richard Socher, Walter Lasecki, Dragomir Radev

EMNLP 2019 (Long Paper)

Paper Data Website Slides Poster

SParC: Cross-Domain Semantic Parsing in Context

Tao Yu, Rui Zhang, Michihiro Yasunaga, Yi Chern Tan, Xi Victoria Lin, Suyi Li, Heyang Er, Irene Li, Bo Pang, Tao Chen, Emily Ji, Shreya Dixit, David Proctor, Sungrok Shim, Jonathan Kraft, Vincent Zhang, Caiming Xiong, Richard Socher and Dragomir Radev

ACL 2019 (Long Paper)

Paper GitHub Data Website

Open Sesame: Getting Inside BERT's Linguistic Knowledge

*Yongjie Lin, *Yi Chern Tan, Robert Frank

ACL 2019 (BlackboxNLP Workshop)

Paper GitHub Poster

Teaching

YData: Seminar on Text Data Science

Undergraduate Learning Assistant (John Lafferty)

Website GitHub

Data Structures and Programming Techniques

Undergraduate Learning Assistant (James Glenn)

Website

Algorithms

Undergraduate Learning Assistant (James Glenn)

Website

Professional Service

Program Committee

EMNLP 2020 Workshop on Interactive and Executable Semantic Parsing (IntEx-SemPar)

Program Committee / Reviewer

EMNLP 2021

NeurIPS 2021 (Outstanding Reviewer Award)

ICLR 2022

ICML 2022