KFServing (KServe)
KFServing, Transformer, Predictor, Explainer
๋ณธ ๋ฌธ์๋ KServe 0.8 ๋ฒ์ ๊ธฐ์ค์ผ๋ก ์์ฑํ์๋ค.
KServe๋ Kubernetes์ ML Model์ Deployํ๊ณ Serving ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ Model Inference Platform์ด๋ค.
InferenceService CR ์์ฑํ๊ณ Kubernetes API Server์ ๋ฑ๋กํ๋ฉด, Transformer, Predictor, Explainer ๋ฑ์ ์์ฑํ์ฌ Inference Service ๋ฅผ ๊ตฌ์ถํ ์ ์๋ค. Knative Serverless๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํธ๋ํฝ์ด ์์ ๋๋ scale-to-zero ๋์ํ๋ค.
Inferenceํ ๋ฐ์ดํฐ์
์์น๋ฅผ ์ ์ํ๋ค. Predictor์ ML Framework spec์ ์ ์ํ ํ endpoint spec์ ์์ฑํ๋ค. ์์ฑํ endpoint spec์ InferenceService Metadata spec์ ์์ฑํด InferenceService๋ฅผ ์์ฑํ๋ค.
์ถ์ฒ: https://kserve.github.io/website/0.8/modelserving/control_plane/ Control Plane Components
KF Serving ๊ตฌ์ฑ์์๋ Endpoint, Transformer, Predictor, Explainer ๊ฐ ์์ผ๋ฉฐ Endpoint ๋ง๋ค Explainer ๋ฅผ ๊ตฌ์ฑํ๊ณ ํ์์ ๋ฐ๋ผ Transformer, Explainer ๋ฅผ ์ถ๊ฐํ ์ ์๋ค.
InferenceService๋ Default Endpoint์ Canary 2๊ฐ๋ฅผ ์ ๊ณตํ๋ฉฐ, Rollout ์ ์ฑ
์ ์ ์ํ์ฌ ํธ๋ํฝ ๋น์จ์ ์กฐ์ ํ ์ ์๋ค.
์ฌ์ฉ์๊ฐ Predictor๋ Explainer ์ํ ์ ํ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ํ์ฒ๋ฆฌ ํ ์ ์๋ค.
ML Model Server๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ๋ ์ญํ ์ ํ๋ค.
XAI๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ ๊ฒฐ๊ณผ์ ๋ํด ํ๋จ ์ด์ ๋ฅผ ์ ์ํ๋ ์ญํ ์ ํ๋ค.
์ถ์ฒ: https://kserve.github.io/website/modelserving/data_plane Response:{"name": , "ready": true/false}
Request:{"instances": []} Response:{"predictions": []}
Request:{"instances": []} Response:{"predictions": [], "explainations": []}
https://kserve.github.io/website/
https://www.kubeflow.org/docs/components/kfserving/
https://devocean.sk.com/blog/techBoardDetail.do?ID=163739
KFServing ์์ ์ ๊ณตํ๋ Endpoint, Transformer, Explainer, Predictor ์ธ์ ๋ ๊ตฌ์ฑ์์๋ฅผ ์ถ๊ฐํ ์์ ์ด๋ฉฐ, Outlier Detection ๋ ๊ทธ ์ค ํ๋์ด๋ค.