はじめにこんにちは。AI Services LabチームのMLエンジニアHeewoong Parkです。私たちのチームでは、オープンチャットに関するさまざまなAI/MLモデルを開発し、提供しています。...| LINEヤフー Tech Blog
Batching speeds up training and inference, but for LLMs we can't just use matrices for it -- we need higher-order tensors.| Giles' Blog
Wrapper for C++ torch::jit::Module with methods, attributes, and parameters.| pytorch.org
torch.device¶| pytorch.org
Introduction to Fluent language, native programming language for pencil & paper| mlajtos.mu
A wrapper for sharding module parameters across data parallel workers.| pytorch.org
torch.tensor()とtorch.Tensor()の違いについての備忘録です。 はじめに torch.tensorとtorch.Tensorの違い 一言で 詳しく 補足: 空のtensorを作るには おわりに 参考 はじめに PyTorchでtensorを作るときはtorch.tensor()メソッドが使われることが多いですね。 一方でtorch.Tensor()のようにクラスのコンストラクタをそのまま呼び出してもtensorを作れるように見えます。 これらふたつ、 torch.tensor() ...| BioErrorLog Tech Blog
This criterion computes the cross entropy loss between input logits| pytorch.org
Base class for all neural network modules.| pytorch.org
Allows the model to jointly attend to information from different representation subspaces.| pytorch.org