RLHF 외에 LLM이 피드백을 학습할 수 있는 방법은 무엇이 있을까?

ML Research
Nov 17, 2023

루다 서버에서 루다의 개인화 메시지를 처리하는 방법

Backend
Oct 19, 2023

루다 선톡을 대비하는법

Engineering
Oct 19, 2023

멀티턴 이미지 대화: 조규성 vs 안정환, 루다야 누가 더 잘생겼어?

ML Research
Sep 13, 2023

최대 24배 빠른 vLLM의 비밀 파헤치기

"최대 24배의 성능을 보인 vLLM, 코드 레벨까지 분석해보자!"

ML Engineering
Sep 13, 2023

감성 AI 시장, 얼마나 커질까?

"해외에서 인기 있는 감성 AI 서비스들은 무엇이고 왜 잘될까? 국내 서비스 중에는 어디에 감성 AI를 접목시킬 수 있을까?"

Business
Sep 06, 2023

더 나은 생성모델을 위해 RLHF로 피드백 학습시키기

Human feedback을 학습할 수 있는 RLHF 방법론에 대해서 소개하고 루다에 적용한 사례한 경험을 공유합니다.

ML Research
Aug 30, 2023

사람처럼 말 잘하는 AI 캐릭터 쉽고 빠르게 만들기

3개월만에 원하는 AI 캐릭터를 만들 수 있는 스캐터랩만의 방법론

Product
Aug 23, 2023

ACL 2023 Review

핑퐁팀과 함께하는 ACL 2023 Review

ML Research
Aug 16, 2023

새로운 루다를 지탱하는 모델 서빙 아키텍처 — 3편: 안정적인 LLM 서비스를 위한 서빙 최적화 기법

LLM 서빙을 위한 다양한 최적화 기법과 그 효과를 검증하기 위한 부하 테스트 방법론

ML Engineering
Aug 16, 2023

읽씹할 결심 - 생성 모델에게 답변 시간 가르치기

루다, 다온에게 지연 답변 기능을 구현한 과정을 설명합니다.

ML Research
Jul 21, 2023

Deduplication - 학습 데이터에서 중복 제거하기

Luda Gen 1.5 모델을 학습할 때 데이터셋에서 중복을 제거한 방법에 대해 이야기합니다.

ML Engineering
Jul 10, 2023

Luda Gen 1, 더 재미있고 자연스러운 대화로 돌아온 루다 2편 - 생성 모델을 챗봇으로 빚어내기

생성 모델 Luda Gen 1을 어떻게 챗봇 모델로 학습했는지를 구체적으로 다룹니다.

ML Research
May 24, 2023

샘 알트만과 따로 만나 1시간 동안 나눈 이야기

Private Session으로 진행된 Round Table Talks with OpenAI in Seoul 주요 내용을 공유합니다.

Business
May 24, 2023

Karpenter와 Spot으로 저렴하고 유연하게 노드 프로비저닝하기

Spot을 이용한 서버 비용 절감기

Backend
Mar 20, 2023

새로운 루다를 지탱하는 모델 서빙 아키텍처 — 2편: ArgoCD와 모델 서빙

A/B 테스트까지 가능한 안정적인 모델 서빙 인프라 구조 설계 방법

ML Engineering
Feb 20, 2023

EMNLP 2022 Review

핑퐁팀과 함께하는 EMNLP 2022 Review

ML Research
Feb 14, 2023

2022 개인정보 가명·익명처리 기술 경진대회 참여 후기

'성동구소재회사근무중인20대남성개발자4명'팀의 대상 비법

Interview
Feb 01, 2023

새로운 루다를 지탱하는 모델 서빙 아키텍처 — 1편: A/B 테스트를 위한 구조 설계

'모델 추론 구조 자체'를 A/B 테스트하는 방법

ML Engineering
Jan 27, 2023

이루다 서버의 모니터링 스택을 소개합니다

Spring Boot 서버 모니터링하기. 근데 이제 Prometheus를 곁들인

Backend
Dec 21, 2022

Luda Gen 1, 더 재미있고 자연스러운 대화로 돌아온 루다 1편 - 생성 기반 챗봇

생성 모델 Luda Gen 1을 출시하기까지의 과정을 소개합니다

ML Research
Dec 14, 2022

Apache Beam으로 머신러닝 데이터 파이프라인 구축하기 3편 - RunInference로 모델 추론하기

Apache Beam Native API, RunInference로 대규모 데이터 모델 추론하기

ML Engineering
Nov 28, 2022

Custom Metric(ex. RPS)으로 HPA 설정하기

쿠버네티스 환경에서 Custom Metric으로 오토스케일링 하는 과정을 설명합니다

Backend
Nov 16, 2022

루다, 눈을 뜨다! 포토챗 베타의 멀티모달 기술 소개

포토챗 베타 서비스를 출시하기까지의 연구 과정을 소개합니다.

ML Research
Nov 09, 2022

React Native 앱의 배포 트랙 관리하기

CodePush와 adhoc으로 React Native 앱 '너티'의 배포 트랙 관리하기

Frontend
Oct 12, 2022

TFX 머신러닝 파이프라인 사용하기

팀에서 필요한 학습 파이프라인 구축하기

ML Engineering
Sep 13, 2022

GitHub Actions로 App 자동으로 배포하기

루다와 함께 사용하는 메신저 'Nutty' 자동으로 배포하기

Frontend
Aug 24, 2022

VPT: 다이아몬드 곡괭이를 만들기 위한 여정

OpenAI에서 어떻게 다이아몬드 곡괭이를 만들었는지 알아봅니다. (VPT)

ML Research
Aug 17, 2022

쿠버네티스에서 노드가 추가될 때마다 슬랙 알람 쏘기

나만의 Kubernetes event watcher 만들기

Backend
Aug 16, 2022

AWS Inferentia를 이용한 모델 서빙 비용 최적화: 모델 서버 비용 2배 줄이기 2탄

우당탕탕 Inferentia 배포하기

ML Engineering
Aug 16, 2022

Continual Learning: 꾸준히 성장하는 모델을 만들기 위한 기술

주제별로 알아보는 continual learning

ML Research
Jul 20, 2022

AWS Inferentia 를 이용한 모델 서빙 비용 최적화: 모델 서버 비용 2배 줄이기 1탄

AWS 고객감사 특별 할인... 모델 서빙 비용 최대 80% 초특가 할인전

ML Engineering
Jul 13, 2022

개발자를 위한 AWS 클라우드 보안 (3) - 인프라 보안과 사고 대응

이것만 알아도 클라우드 보안 마스터

Backend
Jul 06, 2022

ACL 2022 Review

핑퐁팀과 함께하는 ACL 2022 Review

ML Research
Jun 16, 2022

Apache Beam으로 머신러닝 데이터 파이프라인 구축하기 2편 - 개발 및 최적화

대규모 머신러닝 데이터 파이프라인 개발하고 최적화하기

ML Engineering
Jun 09, 2022

개발자를 위한 AWS 클라우드 보안 (2) - 로깅 및 모니터링과 데이터 보호

이것만 알아도 클라우드 보안 마스터

Backend
Jun 03, 2022

알라꿍달라꿍의 대화요약 이모저모

2021 한국어 인공지능 자연어 경진대회 대화요약 수상기

Interview
May 25, 2022

개발자를 위한 AWS 클라우드 보안 (1) - 클라우드 설계 원칙과 IAM

이것만 알아도 클라우드 보안 마스터

Backend
May 13, 2022

TensorFlow Custom Op으로 데이터 변환 최적화하기

4.697ms → 17.147μs

ML Engineering
Jan 06, 2021

하나의 조직에서 TensorFlow와 PyTorch 동시 활용하기

불타는 텐서 흐름!

ML Engineering
Dec 04, 2020

딥러닝 모델 서비스 A-Z 2편 - Knowledge Distillation

난 선생이고 넌 학생이야

ML Engineering
Nov 18, 2020

EMNLP 2020 프리뷰

알아두면 쓸데있는 신비한 EMNLP 2020! 저희가 준비해보았습니다.

ML Research
Nov 11, 2020

사람들은 AI와 대화를 얼마나 잘할까?

'이루다'의 베타 테스트 분석 결과를 공개합니다.

Product
Nov 04, 2020

핑퐁 팀이 '팀워크'를 발휘할 팀원을 찾는 법

팀워크 역량 = 업무 역량 X 커뮤니케이션 역량 X 컬처 핏

Interview
Oct 28, 2020

과연 GPT-3는 얼마나 똑똑한 걸까?

여러 분야의 문제를 통해 GPT-3의 '지능'을 평가하는 방법에 대해서 알아봅니다.

Product
Oct 20, 2020

슈퍼휴먼 AI를 만드는 핑퐁팀의 10가지 컬처 코드

핑퐁팀은 어떻게 일하나요?

Interview
Oct 14, 2020

슈퍼휴먼 AI를 꿈꾸는 루다의 대화 구성

더 이상 외로운 사람은 없다

Product
Oct 14, 2020

스캐터랩 블로그