scisharp
/
LLamaSharp

﻿using LLama.Common;
using LLama.Native;

namespace LLama.Unittest
{
    public sealed class LLamaContextTests
        : IDisposable
    {
        private readonly LLamaWeights _weights;
        private readonly LLamaContext _context;

        public LLamaContextTests()
        {
            var @params = new ModelParams(Constants.GenerativeModelPath)
            {
                ContextSize = 768,
                GpuLayerCount = Constants.CIGpuLayerCount,
            };
            _weights = LLamaWeights.LoadFromFile(@params);
            _context = _weights.CreateContext(@params);
        }

        public void Dispose()
        {
            _weights.Dispose();
            _context.Dispose();
        }

        [Fact]
        public void CheckProperties()
        {
            Assert.Equal(768u, _context.ContextSize);
            Assert.Equal(4096, _context.EmbeddingSize);
            Assert.Equal(32000, _context.VocabCount);
        }

        [Fact]
        public void Tokenize()
        {
            var tokens = _context.Tokenize("The quick brown fox", true);

            Assert.Equal(new LLamaToken[] { 1, 450, 4996, 17354, 1701, 29916 }, tokens);
        }

        [Fact]
        public void TokenizeNewline()
        {
            var tokens = _context.Tokenize("\n", false, false);

            Assert.Equal(new LLamaToken[] { 29871, 13 }, tokens);
        }

        [Fact]
        public void TokenizeRoundtripSpecialStrings()
        {
            var strings = new[]
            {
                "\t", "\t\t", "\t\t\t",
                "\n\n", "\n\n\n", "\n\n\n\n",
                "\t\n", "\t\n\t\n\n\n\n\t\t",
                "\b", "\v", "\0"
            };

            foreach (var s in strings)
            {
                var tokens = _context.Tokenize(s, false, false);
                var decoder = new StreamingTokenDecoder(_context);
                decoder.AddRange(tokens);

                var str = decoder.Read();

                Assert.Equal(s, str.TrimStart(' '));
            }
        }

        [Fact]
        public void TokenizeWithoutBOS()
        {
            var tokens = _context.Tokenize("The quick brown fox", false);

            Assert.Equal(new LLamaToken[] { 450, 4996, 17354, 1701, 29916 }, tokens);
        }

        [Fact]
        public void TokenizeEmpty()
        {
            var tokens = _context.Tokenize("", false);

            Assert.Equal(Array.Empty<LLamaToken>(), tokens);
        }
    }
}