Topic: Can LLMs learn to reason without RL or large datasets?